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MOLECULES D'ACIDES NUCLEIQUES CODANT UNE DEXTRANE- 

SACCHARASE CATALYSANT LA SYNTHESE DE DEXTRANE 
PORTANT DES RAMIFICATIONS DE TYPE ALPHA-1,2 OSIDIQUES 

La presente invention releve du domaine de la 
glycotechnologie et plus particulierement de la synthese d'oligosaccharides 
ou oligosides a effet prebiotique, therapeutique ou diagnostique. 

La presente invention porte sur des molecules d'acides 
nucleiques codant une enzyme ayant une activite de glycosyltransferase 
catalysant la synthese de dextranes ou d'oligosides portant des 
ramifications de type a(1 -» 2) osidiques. 

L'invention porte en outre sur les enzymes synthetisees par 
les acides nucleiques selon l'invention, ainsi que sur leurs systemes 
d'expression dans des cellules procaryotes ou eucaryotes. Elles portent 
enfin sur ('utilisation desdites enzymes dans la production 
d'oligosaccharides dans I'alimentation, ou en tant que principe actif de 
produits therapeutiques et/ou cosmetiques. 

Les oligosides et heterooligosides jouent le role de signaux de 
reconnaissance et d'effecteur chez I'animal comme dans les plantes (on 
parle alors d'oligosaccharines), en se liant specifiquement a des lectines, 
des glycosyltransferases, des glycosidases, des molecules d'adhesion, 
etc... Ainsi, les determinants antigeniques des groupes sanguins sont des 
osides, et notre defense contre nombre de bacteries pathogenes est dirigee 
contre les structures osidiques de I'enveloppe bacterienne. Par ailleurs, 
I'une des raisons majeures du rejet des xenogreffes est ('existence de 
structures osidiques propres a chaque espece. Ces proprietes, ainsi que 
les connaissances acquises ces dernieres annees sur les 
glycosyltransferases et les lectines, contribuent a faire de certains 
oligosides des candidats de choix pour la therapeutique ou la prophylaxie 
des desordres lies a I'equilibre microbiologique de differents organes tels 
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I'intestin, ou la peau. Par exemple, les oligosides constituent une alternative 
interessante a I'utiiisation de microorganismes et d'antibiotiques pour 
reguler la composition de la flore intestinale (effet prebiotique). Certains 
oligosides peuvent etre consideres comme des "fibres solubles" lorsqu'ils 
ne sont pas metabolises par les enzymes digestives humaines et 
animales ; en gagnant le colon, ils interagissent avec la flore microbienne et 
affectent specifiquement la croissance et I'adhesion de certaines especes. 
Incorporees a faible dose (moins de 1 %) dans 1'alimentation, certaines de 
ces molecules osidiques ameliorent I'etat de sante et stimulent la prise de 
poids des animaux. 

Une revue des differentes glycosyltransferases, leur structure 
et leur activite, est decrite dans Vincent Monchois et aL (1). Brievement :. 

a) II apparait que la structure des glycosyltransferases et/ou 
dextrane-saccharases etudiees est tres conservee et est constitute, 
partant de la partie aminee de la proteine, d f une sequence signal, d'un 
domaine variable, d'un domaine catalytique et d'un domaine de liaison au 
glucane. 

b) Les glucooligosides (GOS) sont synthetisables par des 
glycosyltransferases telles les dextrane-saccharases, a partir de substrats 
peu couteux tel le saccharose et en presence d'un sucre accepteur de 
glucose. D'autres substrats, tels Ta-D-fluoro-glucose, le paranitrophenyl-a- 
D-glucopyranoside, I'a-D-glucopyranoside-a-D-sorbofuranoside ou le 4-0- 
a-D-galactopyranosylsucrose peuvent egalement etre utilises. 

Ces enzymes catalysent a partir du substrat le transfert 
d'unites glucose sur des molecules acceptrices. En presence d'un 
accepteur de glucose tel le maltose, ou Tisomaltose, les 
glycosyltransferases catalysent la synthese d'oligosaccharides de bas 
poids moleculaire comprenant » majoritairement des chaTnes de 3 a 7 
glucoses, selon la reaction : 

saccharose + accepteur ► . accepteur glucosyle + fructose 
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En pareil cas, les enzymes presentent generalement une 
specificite de synthese de liaisons osidiques conformes a celle formant le 

polymere donneur. 

En revanche, en absence d'accepteur, I'enzyme synthetise 
des glucanes de haut poids moleculaire de type dextrane par transferts 
successifs d'unites a-D-glucopyranosyles a partir de saccharose, 
conformement a la reaction : 

n saccharose ► (glucose) n + n fructose 

c) Les structures et la fonction des glucanes ou des oligosides 
synthetises par les glycosy transferases dependent de la souche 

bacterienne productrice. 

Dans Tensemble de ce texte, on appellera de fagon generique 
des glycosyltransferases les differentes enzymes capables de catalyser la 
synthese de polymeres de glucose a partir de saccharose. Elles sont 
generalement produites par des souches bacteriennes de type 
Leuconostoc, Lactococcus, Streptococcus ou Neisseria. La taille et la 
structure des glucanes produits dependent de la souche productrice. 

Les unites de glucose sont couplees par des liaisons 
osidiques a(1^6) comme dans le dextrane, par des liaisons a(1~+3), 
comme dans le cas du mutane, ou par une altemance des deux types 
(alternane). 

De la meme fagon, I'existence et la nature des ramifications, 
leur longueur et leur position varient selon I'origine de la souche 
productrice. 

Les glycosyltransferases produisant des glucanes ou des 
GOS contenant au moins 50 % de liaison a(1 -»6) sont appelees dextrane- 
saccharases. Les GOS synthetises par ces enzymes portent, le cas 
echeant, des ramifications a(1-»2), a(W3) et/ou a(1-*4). Lesdites 
dextrane-saccharases sont produites notamment par des bacteries de type 
Leuconostoc mesenteroides. 
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d) La dextrane-saccharase de L mesenteroides NRRL B- 
1299 a la particularite de produire, quant a elle, un dextrane hautement 
ramifie dont la majorite des ramifications sont de type a(1->2). Utilisee en 
presence de saccharose et de maltose, molecule acceptrice de glucose, 
elle conduit a la formation de GOS presentant pour certains une liaison 
a(1^2) a leur extremite non reductrice et pour d'autres des ramifications 
a(1->2) sur les residus intermediates entre les extremites. A ce titre, ils 
resistent a la degradation par les enzymes (hydrolases) du tractus digestif 
superieur, chez Thomme et ['animal, et ne sont degrades que par des 
genres bacteriens capables de fermenter tels Bacteroides et 
Bifidobacterium, consideres comme benefiques pour I'organisme de Thote. 

Un phenomene identique se produit au niveau de la peau, 
permettant d'envisager des applications en cosmetologie, car c'est le 
desequilibre de la flore microbienne cutanee qui est a I'origine de nombreux 
problemes cosmetiques et dermatologiques. C'est en raison de ces 
caracteristiques qu'ils sont designes ici par le terme GOS d'interet 

Dans Tensemble du texte, les polysaccharides synthetises par 
les glycosyltransferases selon ('invention sont soit des dextranes de haut 
poids moleculaire lorsque la reaction est realisee sans accepteur de 
glucose, soit des oligosides lorsque la reaction est realisee en presence 
d'accepteur de glucose tel le maltose ou Tisomaltose sans que cela soit 
necessairement specifie. En effet, la fonctionnalite de Tenzyme est 
caracterisee par la nature des liaisons glucose-glucose [a(1^6), a(1->2)] 
ou autres et non par le poids moleculaire du polysaccharide synthetise. 

Les dextrane-saccharases de L: mesenteroides trouvent deja 
de nombreuses applications dans Tindustrie, et en particulier celles de la 
souche NRRL B-1299 pour lesquelles un precede de synthese des GOS 
presentant des ramifications a(1->2) a ete decrit 4 dans le brevet 
EP 0325 872 B1. 

Marguerite Dols et al. (2) ont montre que les GOS produits par 
les dextrane-saccharases de cette souche sont en fait un melange d'au 
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moins trois families de molecules similaires different de fait par le nombre 
et le positionnement des ramifications de type a(1-»2), ce qui amene 
I'hypothese de I'existence de differentes activites enzymatiques de type 
glycosyltransferase dans cette souche bacterienne. 

Compte tenu de I'interet industriel dans le domaine des 
aliments prebiotiques, en cosmetologie ou en pharmacie des GOS 
presentant des ramifications a(U2) et rappele ci-dessus, la presente 
invention vise a isoler et caracteriser une enzyme particuliere parmi celles 
produites par L. mesenteroides NRRL B-1299 qui serait plus 
particulierement impliquee dans la synthese d'oligosides presentant les 
ramification <x(1-»2). L'identification et la caracterisation d'une telle enzyme 
offrent I'avantage, d'une part, de fournir un procede de production uniforme 
et reproductible des GOS d'interet et, d'autre part, d'identifier les 
caracteristiques essentielles de I'enzyme productrice de ces GOS d'interet, 
afin, le cas echeant, d'ameliorer les performances des produits de la 
reaction enzymatique en fonction de I'utilisation envisagee. 

Le probleme technique sous-tendu dans la presente invention 
etait ainsi de pouvoir disposer d'une enzyme et done des acides nucleiques 
isoles codant cette enzyme permettant la production amelioree de GOS a 
ramifications a(1->2). 

La presente invention apporte une solution technique aux 
differentes questions evoquees ci-avant en fournissant une nouvelle 
dextrane-saccharase, appelee DSR-E codee par un gene dote d'une 
structure nouvelle et inattendue (dsrE) et capable de catalyser la synthese 
des glucanes ou des oligosaccharides contenant des ramifications a(1->2). 

Entre la date de depot de la demande de brevet francais 
N°0103631, dont la priorite est revendiquee et dans laquelle la dextrane- 
saccharase objet de I'invention etait appelee DSR-D, et celle de la presente 
demande, une autre dextrane-saccharase, differente de I'enzyme objet de 
Tinvention, a ete decrite et egalement nommee DSR-D. C'est pourquoi, 
dans le cadre de la presente demande de brevet, la dextrane-saccharase 
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decrite, revendiquee et representee a la figure -lb) est denommee non plus 
DSR-D comme dans le document de priorite, mais DSR-E. De fait, les 
dextrane-saccharases DSR-D selon ledit document de priorite et DSR-E 
sont eh tout point identiques. 

.Par structure nouvelle et. inattendue, on entend le fait que 
l/organisation de la proteine differe de celle de toutes les> autres 
glycosyltransferases decrites a ce jour (1) et dont le domaine catalytique 
est situe en amqnt d'un domaine de liaison au glucane, ce dernier 
constituant la partie carboxylique de la proteine. 

Ainsi, la presente invention porte sur un polypeptide isole 
ayant une activite enzymatique de glycosyltransferase apte a former des 
dextranes presentant des ramifications a(1->2), caracterise en.ce qu'U 
comprend au moins un domaine de liaison au glucane et un domaine a; 
activite catalytique. situe en aval du domaine de liaison au glucane. Pa#|~ 
situe en aval, on entend le fait que la partie aminee de la sequence a-" 
activite catalytique ou . domaine catalytique est proximale de la parties 
carboxylique du domaine de liaison au glucane. Ces deux domainesir 
peuvent etre immediatement contigus ou au contraire separes par une:^ 
region variable. ...... 

La glycosyltransferase selon I'invention comporte de 
preference un peptide signal. 

. Dans un mode de realisation de Tinvention, la 
glycosyltransferase comprend deux domaines catalytiques situes de part et 
d'autre du domaine de liaison au glucane. 

. La presence d'un domaine a activite catalytique dans la partie 
carboxylique de ('enzyme est une caracteristique essentielle de cette 
derniere dans sa capacite a former des liaisons a(1->2) osidiques. En effet, 
comme le montrent les experiences decrites ci-apres, la deletion de ce 
domaine dans une enzyme, ayant au moins deux domaines catalytiques 
conduit a la production de. glucanes ou t d'oligosides ayant essentiellement 
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des liaisons osidiques de type <x(1->6) et depourvus de liaisons de type 

a(1->2). 

Plus precisement, le domaine catalytique, des lors qu'il est 
situe en aval d'un domaine de liaison au glucane, permet la synthese 
d'oligosides contenant des liaisons a(1->2). 

En outre, les experiences decrites ci-apres demontrent que la 
specificite de fonction de la dextrane-saccharase DSR-E, a savoir sa 
capacite a catalyser la formation de liaisons osidiques a(1->2) est 
imputable, non pas a la presence concomitante de deux domaines 
catalytiques, mais plutot a I'enchainement d'un domaine de liaison au 
glucane et d'un domaine catalytique, et plus, particulierement du domaine 

catalytique CD2. 

L'analyse comparative des differentes glycosyltransferases 
incluant les dextrane-saccharases a mis en evidence un tres fort degre de 
conservation de leur domaine catalytique. 

Le domaine catalytique situe dans la partie carboxy-terminale 
de la glycosyltransferase selon Invention a une sequence presentant au 
moins 44 % d'identite et 55 % de similarite avec les domaines catalytiques 
des autres glycosyltransferases analysees. En particulier, le domaine 
catalytique dans la partie carboxylique de la glycosyltransferase selon 
invention a au moins 65 % d'identite et au moins 80 % de similarite avec la 
sequence ID No. 1, la triade catalytique Asp/Glu/Asp en positions 
respectives 230/268/342 etant conservee. 

Dans I'ensemble du texte, on entend par X% de similarite par 
rapport a une sequence de reference le fait que X % des acides amines 
sont identiques ou modifies par substitution conservative telle que definie 
dans le logiciel d'alignement des sequences d'acides amines ClustalW 
f httD:///bioweb.Dasteur.fr/docs/doc - gensoft/clustalw// ) et que (100-X)% 
peuvent etre deletes, substitues par d'autres amino-acides, ou encore que 
(100-X) % peuvent etre ajoutes a la sequence de reference.Une structure 
primaire particuliere de I'enzyme selon I'invention est representee dans la 
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sequence ID No. 2 qui represente une- sequence de 2835 acides -amines 
d'une dextrane-saccharase de L. mesenteroides NRRL B-1299. 

Cette dextrane-saccharase, nommee DSR-E, possede 
comme la plupart des glycosyltransferases et des dextrane-saccharases 
une sequence signal, une region variable faiblement conservee, un 
domaine catalytique hautement conserve (CD1), un domaine de liaison au 
glucane (GBD) et un deuxieme domaine catalytique (CD2) dans la partie 
carboxylique de la proteine. DSR-E est la premiere glycosyltransferase 
analysee et presentant deux domaines catalytiques, dans la configuration 
presentee dans la figure 1 b). C f est egalement la premiere 
glycosyltransferase dont un domaine catalytique est situe dans la partie 
carboxylique de la proteine. 

La figure 1b) fait apparaTtre egalement que le domaine de 
liaison au glucane est sensiblement plus long que celui * xjecrit 
precedemment pour les dextranes saccharases connues ; ainsi, , une "autre 
caracteristique des enzymes selon Invention est la taille de ce domain^ qui 
est superieur a 500 amino : acides. • . . ■ • .h? 

La comparaison et I'analyse de la sequence de DSR-E;avec 
les sequences des glycosyltransferases ou des dextrane-saccharases deja 
decrites (1), ainsi que les moyens utilises a cette fin sont indiques dans 
J'exemple 2 detaille ci-apres. II y apparait clairement que si ^existence de 
deux domaines catalytiques differencie substantiellement. DSR-E des 
autres enzymes, en revanche les sequences desdits domaines sont 
substantiellement conservees. En particulier, les acides amines 
necessaires a Tactivite catalytique . sont conserves dans le deuxieme 
domaine catalytique, a savoir la triade Asp/Glu/Asp situee aux positions 
respective? 2210/2248/2322 de la sequence ID No. 2. 

Ainsi, 1'invention porte egalement sun tout polypeptide isole 
ayant une m activite catalytique de .glycosylstransferase apte a former des 
dextranes ou des oligosaccharides ayant des. ramifications. a(1,->2) tel 
.qu'obtenu par modification, substitution, insertion ou deletion de sequences 
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d'amino-acides mais comportant des sequences presentant au moins 80 % 
et de preference au moins 90 % de similarite avec les sequences suivantes 
de la sequence ID No. 2 : 

423-439 2120-2138 
478-501 2161 -2184 

519-539 2202-2214 
560-571 2243-2250 
631 -645 2315-2322 
1014- 1021 2689-2696 

De facon preferee, enfin, un polypeptide a activite catalytique 
selon I'invention contient les acides amines suivants : 
W en positions 425 et 2122, 
E en positions 430, 565 et 2127, 2248, 
D en positions 487, 489, 527, 638, 2170, 2172, 2210 et 
2322, 

H en position 637 et 2321, 

Q en position 1019 et2694. 
Les polypeptides a activite de glycosyltransferases aptes a 
former des liaisons osidiques a(1->2) peuvent se presenter sous forme 
isolee, ou au contraire integres dans une proteine plus large, comme par 
exemple une proteine de fusion. II peut etre en effet avantageux d'inclure 
des sequences presentant une autre fonction, comme par exemple une 
sequence etiquette specifique d'un ligand permettant d'en faciliter la 
purification. Ces sequences etiquettes peuvent etre du type GST 
(glutathion-S-Transferase), Inteine - CBD (Chitine-Binding Domaine), 
(commercialise par New England Biolabs, http://www.neb.com), MBD 
(Maltose Binding Domain), polypeptides contenant des residus histidine 
contigus permettant de faciliter la purification du polypeptide avec lequel il 
est fusionne. L'homme du metier peut concevoir toute autre proteine de 
fusion permettant d'associer la fonction de la DSR-E de I'invention avec 
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une autre fonction, comme. par . exemple, et sans etre limjtatif, une 
sequence augmentant la stabilite de I'enzyme produite par expression dans 
un hote recombinant ou une sequence apte a augmenter la specificite ou 
I'efficacite d'action de cette enzyme, ou une sequence visant a associer 
une autre activite enzymatique connexe. 

De telles proteines de fusion font egalement partie de 
('invention des lors qu'elles contiennent le domaine CD2 et le site de liaison 
au glucane. De la meme fagon, les fragments de la sequence ID No. 2, 
comprenant au moins la sequence ID No. 1 et le domaine de liaison au 
glucane, seuls ou integres dans une sequence polypeptidique plus large 
font partie de ('invention, a partir du moment ou I'activite enzymatique de 
dextrane-saccharase est conservee. . 

Les variants des ^sequences polypieptidiques definies ci- 
dessus font egalement partie de rinyentipn. Outre les polypeptides obtenus 
par.substitution conservative des acides amines telle^que definie plus^haut, 
les variants incluent des polypeptides dont I'activite enzymatique est 
amelioree par exemple par mutagenese dirigee ou aleatoire, par evolution 
moleculaire, ou par duplication du domaine catalytique CD2. 

La structure particuliere de cette enzyme identifiee dans la 
presente invention resulte d'un processus comprenant : 

a) I'identification et Tisolement de la dextrane-saccharase de 
L mesenteroides catalysant la production des GOS. d'interet portant les 
ramifications a(1 -^2) ; - ■ . 

b) le sequengage de fragments de I'enzyme ; 

c) la synthese d'amorces d'amplification aptes a .amplifier le . 
gene correspondant de la souche productrice ou des fragments de ceux-ci ; 

. d) le sequen^age des fragments amplifies ; : 

v e ) le clonage dans des vecteurs- specif iques et leur expression 
dans des hptes appropries. . . ■ - : 

. , . Les modalites du procede mis en ; oeuvre sont detaillees dans f 
la partie ; experimentale ci-apres. La premiere .etape consiste en une 
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separation des proteines par electrophorese en gel de polyacrylamide, et 
identification des bandes presentant I'activite de dextrane saccharase par 
une reaction enzymatique in situ en presence de substrat et d'accepteur. 
La nature des GOS synthetises est ensuite identifiee sur chaque bande par 
analyse HPLC selon les methodes decrites dans (1). Le temps de retention 
des oligosides en HPLC depend de la nature et de I'organisation de leurs 
liaisons osidiques. II est possible en particulier de distinguer ceux 
constitues de residus lies en a(1->6), en a(1-+6) avec une ramification 
a(W2) a I'extremite non reductrice de la molecule, et ceux recherches 
composes d'une chaTne lineaire a(1->6) avec des ramifications a(1-^2). 

Les inventeurs ont done isole et identifie la dextrane- 
saccharase de L. mesenteroides NRRL B-1299 productrice des GOS 
d'interet. 

Un procede d'ingenierie reverse mis en oeuvre dans les 
etapes b) a e) ci-dessus a permis ensuite de fournir la sequence 
nucleotidique codant I'enzyme et permettant de la produire en quantite 
industrielle et le cas echeant de la modifier, d'en ameliorer ses 
performances par les techniques a la disposition de I'homme du metier. A 
titre d'exemple, on peut citer la mutagenese dirigee ou aleatoire, ou 
revolution moleculaire (DNA shuffling) (3). 

Un autre aspect de I'invention porte sur une molecule d'acide 
nucleique isolee codant une enzyme a activite glycosyltransferase apte a 
former des dextranes ou des oligosides presentant des ramifications 
a(1-*2) et comprenant au moins une sequence codant un domaine de 
liaison au glucane, et au moins une sequence nucleotidique codant un 
domaine catalytique situe en 3' de la precedente, ladite sequence codant 
un domaine catalytique ayant au moins 50 % et de preference au moins 
70 % de similarite avec la sequence ID No. 3. 

Par similarite, on entend le fait que, pour un meme cadre de 
lecture, un triplet donne est traduit par le meme acide amine. Ce terme 
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inclut donc les modifications de bases resultant de la degenerescence du 
code genetique. 

Le pourcentage de similarite est determine en comparant une 
sequence donnee avec la sequence de reference. Lorsque celles-ci sont de 
longueurs differentes, le • pourcentage de similarite est base _sur le 
pourcentage de nucleotides de la sequence la plus courte similaires a ceux 
de la sequence la plus longue. 

Le • .degre de similarite .peut etre determine 
conventionnellement par utilisation de logiciels tels le ClustalW (Thompson 
et a/., Nucleic Acid .Research (1994), 22 : 4673-4680). distribues par Julie, 
Thompson ( Thompson@EMBL-Heidelberg.DE ) et Toby Gibson 
( Gibson(a)EMBL-Heidelberq.DE ) du Laboratoire Europeen. de .Biologie^ 
Moleculaire, Meyerhosfstrasse 1, D-69117 Heidelberg, Germany. ClustalW^ 
peut aussi etre charge a partir de plusieurs sites web incluant IGBMC4- 
.(Jnstitut de Genetique et de Biologie .Moleculaire et Cellulaire, *B.P. 163,^ 
67404 lllkirch cedex France; ftp://ftp-iqbmc.u-strabq.fr/pub/ ) et EBh^ 1 
( ftp : //ftp . eb i . a c . u k/p u b/sof twa re/ ) et tous les sites jenvoyant a I'lnstitut de 
Bioinformatique (Wellcome Trust Genome Campus,, Hinxton, Cambridge^ 
CB10 1SD, UK). ■ . .... 

Les acides nucleiques isoles selon Tinvention t peuvent , 
compreindre notamment d'autres sequences destinees a ameliorer 
['expression et/ou ractiyite.de I'enzyme produite. , 

II peut s'agir a titre d'exemple : 
.. , - des sequences, codant une . sequence signal pour leur 
secretion ; . . . . ... . 

- .une duplication de la sequence codant .le. domaine 
catalytique CD2. . . . ... 

De fapon preferee,- un acide ,nucleique isole s.elon I'invention 

comprend : 
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a) deux sequences codant des domaines catalytiques ayant 
au moins 50 %, et de preference au moins 80 % de similarite avec la 
sequence ID n° 3 ; 

b) une sequence codant le domaine de liaison au glucane, 
5 cette derniere etant situee de preference entre les deux sequences en a). 

Un acide nucleique selon I'invention pourra comprendre en 

outre : 

- un promoteur, apte a son expression dans une cellule hote 

choisie, 

10 - une sequence codant un peptide signal, et/ou 

- une ou des sequences variables, 

cette ou ces sequence(s) etant toutes situees en partie 5' des 
sequences codant le ou les domaine(s) catalytique(s). 

Un exemple particulier d'un acide nucleique isole selon 
15 ('invention comprend plus particulierement : 

a) la sequence ID No. 4, 

b) une sequence presentant au moins 80 % de similarite avec 
la sequence ID n° 4, ou 

c) le brin complementaire de la sequence a) ou b), ou 
20 d) une sequence hybridant a), b) ou c). 

L'hybridation en d) est realisee en conditions standard, et de 
preference en conditions stringentes. Par hybridation en condition 
stringente, on entend le fait qu'il existe une identite de sequences d'au 
moins 80 % de la sequence que Ton cherche a hybrider et de preference 
25 une identite d'au moins 90 % de la sequence que Ton cherche a hybrider, 

dans des conditions decrites par exemple dans Sambrook et Russel 
(3 6me edition, 2001, Cold Spring Harbour Laboratory Press, Cold Spring 
Harbour, NY). 

L'invention porte egalement sur un gene codant une dextrane- 
30 saccharase apte a former au moins 15 % de ramifications a(1->2). Outre la 

sequence codante, le gene comprend les sequences permettant ('initiation 
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de la transcription ainsi -que les sequences permettant Tattachement de 
I'ARN messager au ribosome (RBS). La sequence ID No. 5 represente une 
structure du gene tel qu'isole de L mesenteroides NRRL B-1299. . 

Les nucleotides en amont de TATG d'initiation de la traduction 
sont numerates 1 a 232. . , -v. ; 

,On peut identifier ('existence d'une sequence RBS entre les 
nucleotides 218 et 223, ainsi que les sequences consensus - 35 et - 10 
situees entre les nucleotides 82 et<86 (TTGAA), d'une part et 100 et 105 
(ATAAAT), d'autre part. 

Toute sequence d'acide nucleique hybridable avec TADN de 
la sequence ID No. 4 ou son brin complementaire est susceptible de coder 
une enzyme ayant (es proprietes et caracteristiques.de Tenzyme selon 
Tinvention. Ceci s'applique tant, aux sequences naturelles existant dans- 
d'autres micro-organismes que L mesenteroides NRRL B-1299 et isolees^ 
de banques genomiques de microorganismes, que celles .preparees paf' 
genie genetique ou par synthese chimique. ■ 

En particulier, les sequences en amont de TATG d'initiation d^ 
la traduction et necessaires a ['expression de la proteine peuvent etre ; 
avantageusement substitutes par des sequences d'initiation de la 
transcription et/ou de fixation au ribosome adaptes au systeme 
dlexpression choisi pour la sequence codante. 

Une sequence d'acides nucleiques susceptible de s'hybrider 
en condition stringente avec I'acide nucleique isole selon Tinvention 
comprend egalement des fragments, des derives, ou des variants alleliques 
de la sequence, d'acides nucleiques selon Tinvention qui code: une proteine - 
ayant Tactivite enzymatique decrite ci-avant. Ainsi, les fragments sont 
definis , comme des fragments de molecules d'acides * nucleiques 
suffisamment longs pour coder une proteine ayant conserve son activite 
enzymatique. Celle-ci inclut .aussi bien des fragments depourvus de la 
sequence codant le .peptide signal; responsable. de la .. secretion . de la 
proteine. . . * . . t . - f - . *. 
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Le terme "derive" signifie sequence, difference de la sequence 
originelle, a une ou plusieurs positions, mais presentant un haut degre de 
similarite avec ces sequences. Dans ce contexte, similarite signifie une 
identite d'au moins 80 % des nucleotides, et de preference d'au moins 

5 90 % avec la sequence originelle. Les modifications dans ce cas portent 

sur des deletions, substitutions, insertions ou recombinaisons, a partir du 
moment ou Penzyme codee par ces sequences homologues presentent 
I'activite enzymatique des polypeptides selon I'invention. 

Les sequences d'acides nucleiques selon Pinvention telles que 

10 decrites ci-dessus et qualifiees de derives de ces molecules telles que 

definies ci-avant, sont generalement des variants exenjant la meme 
fonction biologique. Ces variations peuvent etre des variations naturelles, 
notamment celles observables d'une espece a I'autre et resultant d'une 
variability inter espece ou au contraire etre introduces par le moyen d'une 

15 mutagenese dirigee, aleatoire ou par DNA Shuffling (evolution moleculaire). 

De la meme fa?on, font partie de Tinvention les acides 
nucleiques isoles codant une glycosyltransferase apte a catalyser la 
synthese de dextrane ou d'oligosaccharide portant au moins 20 % et de 
preference au moins 30 % de ramifications de type oc(1->2) et obtenus par 

20 evolution moleculaire (DNA shuffling) et comprenant : 

- une etape de modification aleatoire d'une des sequences 
decrites precedemment et, en particulier, des sequences ID Nos. 3 et 4 et 
d'etablissement de variants ; 

- une etape d'expression de ces sequences modifiees dans 
25 une cellule hote appropriee, un hote abritant un variant ; 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 20 % et de preference plus de 30 % de liaisons a(1 2) 
sur un substrat approprie et une etape d'isolement du ou des genes 
ameliores. 

30 Un acide nucleique isole selon I'invention pourra egalement 

comprendre : 
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a) une sequence ayant au moins 80 % de similarity avec la 
sequence codant une dextrane-saccharase exprimee par le plasmide pCR- 
T7 -dsrfE dans E. colt depose a la CNCM le 15 mars 2001 sous le numero I- 
2649 (E. co// JM 109 [pCR-T7-ds/D]) f ou < 
5 ■ b) une sequence complementaire de la sequence en a). 

La denomination de la souche transformee par le plasmide 
■ recombinant pCR-T7-dsrE et deposee a la CNCM est ceile indiquee ci- 
dessus entre parentheses. Cela n'affecte pas le changement de 
denomination du gene opere ulterieurement au depot de ladite souche pour 
I0 .les raisons evoquees supra. - 

L'invention porte egalement sur. les fragments d'acides 
nucleiques tels que definis . ci-dessus, hybridables avec la 
sequence ID No. 4, et utilisables comme sondes .d'hybridation pour la 
detection de sequences codant des enzymes selon rinventioh;?Ces 
15 ; fragments peuvent etre prepares par toutes les .techniques, connues de 
rhomme'du metier. ■ •> • r*. 

Outre les sondes d'hybridation, des amorces d'amplifieation 
font egalement partie de l'invention. Lesdites amorces sont des fragments 
hybridables avec la SEQ ID No. 4 ou avec son brin complementaire et 
20 permettent Pamplification de sequences specifiques codant des dextrane- - 

saccharases presentes dans un organisme procaryote ou eucaryote, 
animal ou vegetal. - . • 

L'utilisation de telles amorces d'amplifieation permet la mise 
en oeuvre d'un precede d'identification de ['existence eventuelle d'un gene 
25 codant une enzyme apte a catalyser la synthese de GOS avec des " 

ramifications a(1->2) ■ dans un tel organisme, ledit precede faisant 
egalement partie de ('invention. . ,. . ..... 

L'invention porte egalement sur des vecteurs d'expression 
comprenant un acide nucleique tel que decrit ci-avant, sous le controle de 
30 r sequence permettant son expression et de preference son excretion dans " 
des cellules procaryotes ou eucaryotes. Par cellules procaryotes, on 
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choisira de preference des bacteries choisies dans un groupe comprenant 
E. coli, les Lactococcus, les Bacillus, les Leuconostoc. Par cellules 
eucaryotes, on choisira de preference les eucaryotes choisis dans un 
groupe contenant les levures, les champignons ou les vegetaux. 

Le vecteur comprend un promoteur adapte a I'expression de 
I'acide nucleique isole selon I'invention dans le systeme d'expression choisi. 
A titre d'exemple, le promoteur du bacteriophage T7 pourrait etre 
avantageusement choisi pour une expression dans E. coli. 

L'invention porte egalement sur les cellules hotes, procaryotes 
ou eucaryotes, transformees par un acide nucleique selon l'invention de 
preference compris dans un vecteur d'expression portant un promoteur, 
adapte a une expression dans les cellules hotes choisies. Les cellules 
transformees sont choisies dans le groupe des bacteries a Gram- telle E. 
coli, ou dans le groupe des bacteries a Gram+ telles Lactococcus, Bacillus, 
Leuconostoc ou parmi les eucaryotes dans un groupe comprenant les 
levures ou les champignons, ou les vegetaux. 

Un exemple particulier d'une cellule transformer selon 
l'invention est la souche E. coli hebergeant un plasmide appele PCR- 
T7dsrE et porteur de la sequence ID No. 4 sous le controle du promoteur 
du bacteriophage T7 et deposee a la CNCM le 15 mars 2001 sous le 
numero I-2649. 

La presente invention, par ailleurs, porte sur un procede de 
production d'une glycosyltransferase apte a former des dextranes ou des 
oligosides presentant au moins 1 5 % et de preference au moins 20 % de 
ramifications de type a(1-»2) osidiques et comprenant : 

a) I'insertion d'un acide nucleique ou d'un vecteur tel que 
decrit precedemment dans une cellule hote apte a I'exprimer et de 
preference a secreter la glycosyltransferase ; 

b) la caracterisation de I'activite enzymatique recherchee par 
toutes les methodes accessibles a I'homme du metier ; 

c) la purification de I'enzyme a partir d'un extrait cellulaire. 
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. . Par methode de caracterisation ; .de I'activite enzymatique 
connue de I'homme du metier, on comprendra les methodes decrites dans 
la litterature par exemple dans la reference (2).ainsi que de nouvelles 
methodes susceptibles d'etre mises au point permettant d'identifier et de 
discriminer les gfucooligosaccharides presentant le taux de ramification 
recherche. . > . . . 

.. t IL s'agit en fait de tout precede de cribiage permettant 

d'identifier la presence de ramifications a(1^>2) dans un GOS. 

A titre d'exemple, seront utilisees : 
v .< . (; - THPLC pour lequel la migration des GOS varie en fonction 
de la nature et le positionnement des ramifications, notamment ceux ayant 
le-lien a(1^2) a I'extremite reductrice et ceux ayant ce lien sur Pavant- 
dernier. glucose, et/ou ; v ; - - i ^ 

- - - la Resonance* magnetique nucleaire (RMN), ■** - ^ 

- ('existence d'une reaction positives avec 'des -anticorps 
monoclonaux specifiques des liaisons a(1->2) sur I'extremite red uct nee 
et/ou d'anticorps monoclonaux specifiques des liaisons a(1-»2) sur I'avarit- 
dernier glucose du GOS. < - vr 

* ^'invention porte egalement sur un precede d'obtention d'une 
glycosyltransferase apte a presenter des bligosides ou des dextranes 
presentant un taux de ramification a(1-»2) superieur a 15 % et de 
preference superieur a 30 % de la totalite des liaisons osidiques et 
comprenant uhe etape de modification de la sequence ID No. 4 par 
addition, deletion, mutation a partir du moment ou : ■ * * * 

- le cadre de lecture'n'est pas modifie, et * 

- les acides amines suivants sont conserves apres traduction : 

W' en positions 425 ou 2122, code par le'Viplet TGG en 
positions 1273 et 6364, : . " - " J » - ■ 

-E.en positions 430, 565, 2127 et 2248 codes par les 
triplets GAA en positions 1288, 4693, 6379 et 6742 respectivement, 
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D en positions 487, 489, 527, 638, 2170 et 2210 codes par 
ies triplets GAT en positions 1459, 1465, 1579, 1912, 6508 et 6628 
respectivement, 

D en positions 2172 et 2322 codes par Ies triplets GAT en 

positions 6514 et 6964, 

H en position 637 et 2321, codes respectivement par Ies 
triplets CAT en position 1909 et CAC en position 6961, 

Q en positions 1019 et 2694 codes respectivement par Ies 
triplets CAA (position 3055) et CAG (position 8080). . 

Un procede de production d'une glycosy (transferase selon 
I'invention ayant Ies memes caracteristiques que ci-avant peut egalement 
comprendre : 

- une etape de modification aleatoire de la sequence ID n° 4 
et d'etablissement d'une banque de variants, 

„ une etape d'expression de ces sequences modifiees dans 
une cellule hote appropriee, un hote abritant un variant, 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 15 % et de preference plus de 30 % de liaison a(1 2) 
sur un substrat approprie, 

- une etape d'isolement du ou des genes ameliores. 

Dans un autre mode de realisation de ['invention, le procede 
consiste a modifier la sequence ID No. 3 par duplication de tout ou partie 
du domaine catalytique CD2. 

On pourra comprendre que Ies procedes ci-dessus visent non 
seulement a I'obtention d'une glycosyltransferase apte a former des 
oligosides presentant un taux de ramification a(1 -^2) constant et 
reproductible, superieur a 15 % des ramifications totales mais egalement a 
ameliorer le taux de ramification a(1 2) dans I'objectif de modifier Ies 
proprietes des oligosides obtenus dans le sens d'une amelioration de leurs 
proprietes dietetiques ou de leur capacite a maintenir ou retablir la flore 
bacterienne associee a certains organes du corps humain ou animal. 
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La presente invention porte- enfin sur les glycosyltransferases 
susceptibles d'etre obtenues par un procede cite ci-avant et apte a former 
au moins 15 % et de preference au moins 30 % de ramifications de type 
a(1 -> 2) osidiques dans des glucooligosaccharides. 

L'invention porte enfin sur ('utilisation des glycosyltransferases 
selon,. ('invention ainsi que celles susceptibles d'etre obtenues par les 
procedes ci-dessus, dans, la fabrication d'une composition a effet 
prebiotique ou dans la fabrication d'une composition dermatologique, 
cosmetique ou pharmaceutique. - 

A titre d'exemples non limitatifs, on peut citer I'amelioration du 
transit intestinal chez les animaux et chez Thomme, ('amelioration de 
('assimilation du calcium et/ou du magnesium et des mineraux en general, 
la prevention du cancer du colon, la prevention; ou le traitemerit des 
affections de la peau telles Tacne, les pellicules, les odeurs corporellefe. 

. . L'avantage des polypeptides et des acides nucleiques codant 
ces polypeptides selon ('invention se situe non.seulement;au niveau de 
I'amelioration en terme de qualite, de rendement, de reproductibilite/et de 
prix , de revient des glycosyltransferases aptes a* former^ des 
oligosaccharides avec des ramifications de type a(1 -> 2) osidiques mais 
egalement dans la perspective de produire de nouvelles enzymes dont la 
ionctionnalite est amelioree. 

Les figures, exemples et description detailles ci-apres 
permettent, sans la limiter, d'illustrer les caracteristiques et les 
fonctionnalites particulieres des polypeptides a activite enzymatique et des 
sequences codant ceux-ci. Elles permettent en* particulier -d'illustrer de " 
fa?on plus precise la specificite du domaine catalytique present dans la 
partie carboxylique de I'enzyme selon ('invention et son evolution- potentielle 
pour Contention d'enzymes ameliorees. . ■■ . , ...... 
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LEGENDE PES FIGURES : 

Figure 1 : structure des glycosyltransf erases natives et des 
proteines recombinantes derivees : la figure 1a) represente la structure des 
glycosyltransferases et des dextrane-saccharases decrites dans la 
litterature (1). PS : peptide signal ; ZV : region variable, CD : domaine 
catalytique, GBD : domaine de liaison au glucane. La figure 1b) represente 
la structure de la glycosyltransferase selon I'invention. Les figures 1c) a 1i) 
represented differentes constructions comportant des deletions en 
comparaison de la proteine DSR-E native. A(PS) correspond au controle 
constitue par la forme entiere donee dans le systeme pBAD-TOPO 
Thiofusion (Invitrogen). 

Figure 2 : schema recapitulatif de la methode de clonage de la 
sequence nucleotidique codant une glycosyltransferase selon I'invention a 
I'aide d'une bibliotheque genomique en utilisant une sonde PCR decrite 
dans le tableau I et une sonde H/ndlll/EcoRV respectivement. 

Figure 3 : comparaison des sequences signal de differentes 
glycosyltransferases de L mesenteroides: Les acides amines conserves 
sont en gras. DSR-B : L. mesenteroides NRRL B-1299 (4); DSR-S : 
L. mesenteroides NRRL B-512F (5) ; ASR: L. mesenteroides NRRL B-1355 
(6). 

Figure 4 : alignement des 1 1 sequences repetees de I'enzyme 
DSR-E et observees dans la zone variable. 

Figure 5 : alignement des sequences conservees du domaine 

catalytique. 

- Bloc A : acides amines essentiels de la partie N-terminale du 
domaine catalytique ; 

- Bloc B : acides amines de la partie du domaine catalytique 
de liaison au saccharose ; 

- Blocs C, D, E : blocs contenant les trois residus d'acides 
amines impliques dans la triade catalytique (6) ; 
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- Bloc F : sequence contenant la glutamine 937 de GTF-I 
etudiee par Monchois et ai (7). 

Les* acides amines entierement conserves sont indiques en 
gras. « * » : substitutions conservatives ; « : » : substitutions semi- 
conservatives ; — : GAP. Les numerotations sont celies de la sequence ID 
No. 2. . : . 

Figure 6 : caracterisation HPLC des produits synthetises par 
I'enzyme recombinante DSR-E. 

6A : analyse en HPLC des glucooligosaccharides obtenus 
avec les dextrane-saccharases de L. mesenteroides NRRL B-1299. 

6B : analyse HPLG des glucooligosaccharides obtenus par la 
DSR-E recombinante. ^identification des differents pics suivants : 

1 : fructose, . ■. • - : 

. , . 2 : maltose, . , ft 

3 : sucrose, • ■ ■ v** 1 . ■ * \ - « : * * 

. , 4 : panose, . ■ . v v - V r \V 

5 : R4, ...*.. - d 

6 : OD4, . 

7:R5, . < 

8 : OD5, 

A, B, C : pics non identifies. 

6C : DSR-E recombinante deletee du domaine catalytique de 
la partie carboxylique de 1'enzyme (A DSR-E). 

Figure 7 : analyse HPLC des produits de la reaction 
d'accepteur sur maltose, synthetises par les differentes formes entieres et 
deletees de la proteine DSR-E. <* ; 

L. m. B-1299 : melange de dextrane-saccharases produit par 
L mesenteroides NRRL B-1299. . . 

L'identification des differents pics se fait comme suit : 

F : fructose ■ ... - v ...... : ; * % ,,y 

M : maltose 
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S : saccharose 
P : panose 

R4, R5 : GOS comportant des liaisons a(1->2) 
OD4, OD5 : GOS depourvus de liaisons a(1->2). 
MATERIELS ET METHQDES : 

1) Souches bacteriennes. plasmides et conditions de 

croissance : 

Toutes les souches sont conservees a -80°C dans des tubes 
contenant 15% de glycerol (v/v). 

Leuconostoc mesenteroides B-1299 (NRRL, Peoria, USA) est 
cultivee a 27°C, sous agitation (200 RPM) sur milieu standard (saccharose 
40 g.l' 1 , phosphate potassium 20 g.l" 1 , extrait de levure 20 g.l" 1 , MgS0 4 - 
7H 2 0 0.2 g.r 1 , MnS0 4 -H 2 0 0.01g.l\ NaCI 0.01gT 1 , CaCI 2 0.02 g.l" 1 , 
FeS0 4 -7H 2 0 0.01 g.l" 1 ), le pH etant ajuste a 6,9. 

Escherichia coli DH5a et JM109 ont ete cultivees sur milieu LB 
(Luria-Bertani). 

La selection des clones recombinants de pUC18 ou pGEM-T Easy 
est effectuee sur boites LB-agar supplements avec 100 ug.ml" 1 
d'ampicilline, 0.5 mM d'isopropyl-|3-D-thiogalactopyranoside (IPTG) et 40 
pg.ml" 1 de 5-bromo-4-chloro-3-indolyl-p-D-galactopyranoside (X-gal). Des 
cellules d' E. coli TOP 10 ont ete utilisees pour le systeme de clonage de 
produit PCR TOPO Cloning (Invitrogen), et cultivees sur milieu LB 
supplements de kanamycine a la concentration de 50 ug.ml" 1 . 

En ce qui concerne I'expression de dsrc., le kit de clonage ECHO 
Cloning System (Invitrogen) permet le clonage d'un produit PCR dans un 
vecteur donneur (pUNIA/5-His-TOPO), precedant une etape de 
recombinaison avec un vecteur accepteur adapte (pCR-T7-E). Ce systeme 
requiert des cellules E. coli PYR1, TOP 10 et BL21(DE3)pLysS cultivees 
sur milieu LB supplements de 50 ug.ml" 1 de kanamycine, ainsi que de 
34 pg.ml" 1 de chloramphenicol pour la souche BL21(DE3)pLysS. 
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Les plasmides pUC18 digeres et dephosphoryles proviennent 
de Pharmacia (Amersham Pharmacia Biotech) et ont ete utilises pour la 
constitution de banque d'ADN genomique de L mesenteroides NRRL B- 
1299. Le : clonage de produit PGR a, quant a lui, necessite i'emploi de 
plasmide pGEM-T Easy (Promega), et pour les fragments de plus de 2 kbp, 
de plasmide TOPO-XL (Invitrogen). 

Le systeme pBAD-TOPO Thiofusion (Invitrogen), utilise pour 
construire les differentes formes deletees de la proteine DSR-E, met en jeu 
le promoteur araBAD, dont les mecanismes de controle impliquent la 
proteine regulatrice AraC. En I'absence d'inducteur, a savoir le L-arabinose, 
la proteine dimerique AraC s'associe aux structures regulatrices de I'operon 
et entraine la formation d'une boucle d'ADN, ladite boucle bloquant ainsi la 
transcription des genes places sous le controle du promoteur araBAD. En 
presence de L-arabinose en .revanche, AraC forme un complexe, c'e qui 
libere la boucle d'ADN et permet Tinitiation de la transcription. L'expre'ssioa 
basale peut etre limitee en ajoutant du glucose au milieu de culture : eelui- 
ci intervient en diminuant le niveau d'AMP cyclique, et done I'actiyation 
concomitante de la proteine CAP (cAMP activator protein). Le niveau 
d'activation obtenu est fonction de la concentration en L-arabinose, de telle 
sorte que fes conditions optimales de production de la proteine d'interet 
peuvent etre selectionnees avec precision, 

De plus, I'emploi de ce vecteur permet de positionner une 
etiquette thioredoxine de 12 kDa du cote N-terminal de la proteine d'interet. 
Cette fusion vise a favoriser la traduction du gene codant ladite proteine 
d'interet. La proteine etiquette permet en outre d'augmenter la.solubilite de 
la proteine a laquelle elle se. trouve fusionnee. Le systeme pBAD-TOPO 
Thiofusion ^est ( con?u pour permettre d'eliminer t facilement, Tetiquette 
thioredoxine, par simple clivage a Taide de Tenterokinase. Enfin,. grace a ce 
systeme depression, une etiquette histidine est inseree du. cote de 
Textremite C-terminale de la proteine d'interet. JJne .telle etiquette est utile 
pour purifier ladite proteine par affinite. 
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Dans le cadre de ['utilisation de ce systeme, la souche E. coli 
TOP 10 a ete cultivee sur milieu LB supplements de 100 ug.mr 1 
d'ampicilline. 

2) Electrophorese sur gel, localisation et ca racterisation de 

I'enzyme : 

Apres une culture de L. mesenteroides NRRL B-1299 de 7h, 
le milieu a ete centrifuge (7000 RPM, 4°C, 30 min) et les cellules, ou 90% 
de I'activite enzymatique se retrouve, ont ete concentrees 10 fois dans une 
solution de tampon acetate (20 mM, pH 5,4), chauffees 5 minutes a 95°C 
en presence de solution de denaturation (Tris HCI 62.5 mM, SDS 4%, uree 
6M, bleu de bromophenol 0.01% et p-mercaptoethanol 200 mM). 300 pi du 
melange a ete depose sur gel de polyacrylamide a 7%. Apres migration, les 
proteines totales ont ete revelees par coloration au noir amido, alors que 
I'activite dextrane-saccharase a ete detectee par coloration du polymere au 
reactif de Schiff apres synthese de dextrane in situ. Les bandes 
correspondant a des dextrane-saccharases actives ont ete excisees et 
incubees separement dans 2 ml de solution d'acetate de sodium 20 mM pH 
5.4 contenant 100g.r 1 de saccharose et 50 g.l" 1 de maltose. Apres 
consommation totale du saccharose, la reaction a ete arretee par chauffage 
a 95°C pendant 5 minutes, et le milieu reactionnel centrifuge 5 minutes a 
15000g afin d'eliminer le dextrane insoluble. Les echantillons ont ete 
analyses par chromatographie en phase inverse ( colonne C18, Ultrasep 
100, 6 pm, 5x300mm, Bishoff Chromatography) en utilisant de I'eau 
ultrapure comme eluant, a un debit constant de 0.5 ml.min" 1 . Les 
oligosaccharides ont ete separes pendant 30 minutes a temperature 
ambiante, et detectes par refractometrie. Le sequengage peptidique a ete 
realise sur les bandes proteiques selectionnees par le Laboratoire de 
Microsequencage, Institut Pasteur, Paris. 

3) Techniques de bioloqie moleculaire utilisees : 
La purification du plasmide de E. coli et la purification de 
I'ADN genomique de L mesenteroides ont ete realisees en utilisation 
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respectivement QiaPrep Spin Plasmid kit et le Cell Culture DNA maxi kit 
(QiaGen). Les procedes d'amplification et de clonage ont ete realises en 
utilisant les techniques standard (Sambrook et Russel, 2001, supra). Les 
enzymes de restriction et de modification, provenant des societes 
commerciales New England Biolabs ou Gibco BRL, ont ete.utilisees selon 
les prptocoles des fabricants. 

La PCR a ete realisee avec des amorces choisies sur la base 
. de-la sequence proteique pbtenue sur une bande de gel d'electrophorese 
isolee (voir supra, electrophorese sur gel et localisation de Tenzyme). Deux 
peptides ont ete sele.ctionnes : -■, 

- 29-FYFESGK, et , ^ ; 

... - 24-FESQNNNP. - . ^ 

et utilises pour synthetiser des oligonucleotides degeneres et indiques"dans 
le tableau I ci-dessous. : : • v - -58* 

Dans ce ^tableau ou les numerotations sont celles ^Je la ; 
. . sequence ID no.. 4, il apparaTt que la. presence d'un residu serine dans les 
deux peptides nepessite la synthese de deux amorces pour chaque peptide 
dans la mesure ou la serine peut etre codee par six codons diffeffents. 
ECHO-dir et ECHO-inv sont les amorces utilisees ayant ;. permis 
('amplification de cterE par PCR pour son clonage dans le systeme 
d'expression ECHO Cloning (Invitrogen). 





TABLEAU I 




Designation 


Description 


Sequence 5'-3' 


29-dir1 
29-dir2 


FYFESGK 


• TT(C/T)TA(C/T)TT(C/T)GA(A/G)rC>4GG(C/G)AA(A/G) 
TT(C/T)TA(C/T)TT(C/T)GA(A/G)>!\GCGG(C/G)AA(A/G) 


24-inv1 
• 24-inv2"" 


FESQNNNP 


(T/G)GG(G/A)TT(G/A)TT(G/A)TTTTG 7G/l(T/C)TCAAA 
(T/G)GG(G/A)TT(G/A)TT(G/A) MM GGC7(T/C)TCAAA 


IPCR-rev 
IPCR-dir 


sequence nt 
5769-5798 

sequence nt 
8311-8342 


CCCTTTACAAGCTGATTTTGCTTATCTGCG 
GGGTCAAATCCTTACTATACATTGTCACACGG 


ECHO-dir 

> 


sequence nt -6 - 
39 

sequence nt 
8457-8504 


AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG 


ECHO-iny 


ATTTGAGGTAATGTTGATTTATCACCATCAAGCTTGAAATATTGACC 
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PGR : 

La PCR a ete realisee en utilisant un thermocycleur Perkin- 
Elmer, modele 2400, et avec 50 nanogrammes d'ADN genomique. Les 
quantites d'amorces utilisees etaient de 10 pM de 29-Dir1 et de 24-lnv1. Au 
melange reactionnel, ont ete ajoutes 250 uM de chaque desoxynucleotide 
triphosphate, et la Taq Polymerase. 

Apres une amplification de 25 cycles a 94° C pendant 
30 secondes puis a 50° C pendant 30 secondes, puis a 72° C pendant 
5 minutes, un fragment de 666 paires de base a ete obtenu. 

Certains fragments ont ete amplifies a I'aide du systeme 
« Expand Long Template PCR » (Roche Boehringer Mannheim), 
conformement aux indications d'utilisation du fournisseur. Ce systeme 
permet d 'amplifier des fragments de grande taille, jusqu'a environ 20 kbp, 
de maniere tres efficace. La combinaison de deux ADN polymerases 
permet notamment de minimiser le taux d'erreur durant les etapes 
d'elongation. 

Hybridation southern et bibliotheaue genom ique de L. 
mesenteroides NRRL B-1299 : 

L'ADN chromosomique de L. mesenteroides NRRL B-1299 a 
ete digere avec differentes enzymes de restriction, puis separe par 
electrophorese sur gel d'agarose a 0,8 % en tampon TAE 0,5X. 

Des bibliotheques genomiques de la bacterie ont ete 
transferees sur des membranes de nylon hybond N+ (Amersham 
PharmaciaBiotech). L'hybridation a ete realisee en utilisant le fragment de 
666 paires de bases a la desoxy-adenosine-triphosphate marque au 32 P. La 
reaction de marquage a ete realisee en utilisant le kit de marquage "Mega 
Prime DNA Labelling System Kit" (Amersham PharmaciaBiotech), suivie 
par la purification de la sonde sur des colonnes MicroSpin S-200HR. La 
pre-hybridation et l'hybridation ont ete realisees en conditions fortement 
stringentes (65° C pendant la nuit, selon les methodes habituelles) 
(Sambrook et Russel, 2001, supra). 
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PCR inverse : 

La reaction de PCR inverse permet d'obtenir un fragment 
d'ADN lineaire a partir d'une matrice circulaire en utilisant des amorces 
divergentes.-. - r 

5 ; ; L'ADN genomique de L mesenteroides NRRL.B-1299 a ete 

digere par EcoRV dans les conditions recommandees par.-le fournisseur. 
v .. Apres re-circularisation, les produits de digestion ont ete 

. ^ utilises comme matrice dans une reaction de PCR inverse [Extrapol II DNA 
polymerase (Eurobio), volume reactipnnel de 50 pi, parametres de la 
10 - reaction de PCR inverse : 25 cycles 94° C, 30 secondes ; 51° C, 
- r : . 30 secondes ; 72° C, 3 minutes]. Les deux amorces ont ete choisies en 
: fonction de la sequence de I'insert de pSB2 comme indique ,dans la 
. , figure 2. . - . , . , ?| 

La figure 2 resume les modalites d'obtention des diffe rents 
15; v plasmides porteurs des fragments de dsrE par criblage de la bibliptffeque , 
genomique et utilisation des sondes decrites ci-dessus. 
• Sequence d'ADN et analyse : 

Apres le sequengage des peptides, des amorces degenferees 
dessinees en tenant compte de la frequence d'utilisation des codons'tians 
20 les genes de-dextrane-saccharases de L mesenteroides NRRL B-1299, 

ont ete synthetisees et ont permis ['amplification d'un fragment de 666 bp. 
Le sequengage de ce fragment a revele .de fortes homologies avec les 
• genes de dextrane-saccharases deja connus, tout en etant totalement 
L , . nouveau. . . . . : . 

25 r L'utilisation de ce fragment comme sonde homologue dans' . 

. . , * des experiences de Southern, a permis de reperer des signaux positifs sur 
> v differentes pistes d^ADN genomique digere. Une premiere banque H/ndlll a 
. * ainsi ete criblee, et un plasmide recombinant, nomme pSB2, contenant un 
• * insert de 5,6 kbp, a ete purifie. L'analyse de la sequence de ce fragment 
30 -: , HjndWl a revele un cadre ouvert de lecture couvrant la totalite de I'insert. 

Ensuite, une banque EcoRV a ete .criblee, avec une sonde /-//ndlll/EcoRV 
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isolee a I'extremite N-terminale de I'insert H/ndlll de 5,6 kbp. Un plasmide 
recombinant pSB3, teste positivement par dot-blot, s'est avere contenir un 
insert de 3,8 kbp qui, apres sequencage, a ete montre contenir le codon 
d'initiation de la traduction et la region promotrice du nouveau gene de 
dextrane-saccharase nomme dsrE. 

Dans le but d'obtenir le codon de terminaison de cferE, une 
PCR inverse a ete realisee sur de I'ADN genomique de L. mesenteroides 
NRRL B-1299 digere par EcoRV et religue sur lui-meme, en utilisant des 
amorces oligonucleotidiques divergentes dessinees a partirde la sequence 
de I'insert pSB2. Un fragment unique a la taille attendue de 1 kbp a ete 
amplifies puis clone dans un pGEM-T Easy, pour obtenir le plasmide pSB4. 
Apres sequencage, la sequence amplifiee situee en aval du site H/ndlll 
comporte 221 bp et contient le codon de terminaison du cadre de lecture de 
c/srE, situe 30 bp en aval du site de restriction H/ndlll. 

Le sequencage des differents fragments portes par les trois 
plasmides a ete realise par la societe Genome Express et ce, sur les deux 
brins. Les analyses des sequences de nucleotides ont ete realisees en 
utilisant le "ORF Finder" mttD://www.ncbi.nlm.nih.aov/qorf/aorf.html ), Blast 
( http://www.ncbi.nlm. nih.aov/blast/blast.cqi , Altschul et ai. t 1997) ClustalW 
( http://www2.ebi.ac.uk/clustalw , Thompson et a/., 1994), PRODOM 
( http://protein.toulouse.inra.fr/prodom.html , Corpet et a/., 2000), PFAM 
( http://pfam.wustl.edu/hmmsearch.shtml . Bateman et a/., 2000) et SAPS 
( http://bioweb.pasteur.fr/seaanal/interfaces/saps.html , Brendel etai, 1992), 
I'ensemble de ces logiciels etant accessible par internet. 
Expression de la proteine : 

Deux systemes de clonage et d'expression ont ete utilises aux 
fins de la production de proteines recombinantes chez E. coli, a savoir les 
systemes ECHO-Cloning et pBAD-TOPO Thiofusion (Invitrogen). 

A titre d'exemple, se trouve brievement decrite ci-apres la 
methode de clonage de la sequence nucleotidique codant la proteine DSR- 
E au moyen du systeme ECHO-Cloning. 
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Deux amorces telles que proposees dans le tableau I ci- 
dessus ont ete utilisees dans le cadre de ('amplification a I'aide du systeme 
"Expand Long Template" dans les conditions suivantes : 94° C pendant 3 
minutes suivis de 25 cycles a 94° C pendant 30 secondes, 55° C pendant 
30 secondes, et 68° C pendant 7 minutes. Les produits PCR ont ensuite 
ete clones dans le vecteur pUNIA/5-His-TOPO, permettant I'obtention d'un 
vecteur donneur (pUNI-cferE) a recombiner avec un vecteur accepteur 
(pCR-T7-E) et adapte a ('expression dans E. coli. Le plasmide final a ete 
designe pCR-T7-c/srE. 

Cette construction, plagant le gene .dsrE sous le controle du 
promoteur. du bacteriophage T7, a^permis I'expression inductible du gene 
dsrE. 

Apres induction avec 1 mM d'IPTG, les cellules de E. colli- 
BL21 transformees ont ete recoltees par centrifugation apres 4 heures de p 
croissance, et re-suspendues .a une densite optique finale de 80 a 600 nm <£. 
dans du tampon acetate de sodium 20 mM pH 5,4 et du Triton X100 a 1% % 
(v/v) en, presence de 1 mM PMSF afin d'empecher la proteolyse dans les 
extraits cellulaires apres sonication. ^ 

Des experiences similaires, realisee avec le systeme pBAD- ' • 
TOPO Thiofusion, ont permis de construire le vecteur recombinant pBAD- 
TOPO-c/srE. 

Tests enzymatiques : 

Les reactions enzymatiques ont. ete realisees dans les 
conditions standard a,30 °C dans du tampon acetate de sodium 20 mM pH 
5,4, NaN 3 1 g/l" 1 et saccharose 100 g/r\ Uactivite de Tenzyme DSR-E a ete 
determinee en mesurant la vitesse de liberation des sucres reducteurs, 
representes en I'espece par le fructose, a I'aide de la methode a I'acide 
dinitro-salicylique bien connue de I'homme du metier. Une unite a ete 
definie comme la quantite d'enzyme qui catalysait la formation d'1 pmol de 
fructose par minute dans les conditions, standard. Les oligosaccharides ont 
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ete synthetises dans un milieu reactionnel contenant 1 00 g/I de maltose, 
200 g/I de saccharose et 0,5 unites/ml de DSR-E. 

Comme pour la synthese de dextrane, la reaction 
enzymatique a ete poursuivie pendant 24 heures en presence de 100 g/I de 
5 glucose. Le dextrane produit a ete precipite en presence d'ethanol 50 % 

(v/v) et lave deux fois dans I'ethanol a 50 % (v/v) avant lyophilisation. II a 
ensuite ete dissous a 10 mg/ml dans du D 2 0 et analyse par spectrometrie 
deRMrl du 13 C. 

Separation par HPLC : 
10 Des echantillons de 100 pi ont ete preleves et chauffes a 

95 °C pendant 5 minutes, puis dilues dans de I'eau ultra-pure de maniere a 
obtenir une concentration finale en sucres totaux inferieure a 5g.!' 1 . Apres 
centrifugation, les substrats residuels et les differentes especes formees 
ont ete analyses par HPLC sur colonne C18 (Ultrasep 100, 6 pm t 
15 5x300 mm, Bishoff Chromatography). 

La separation des oligosides a ete realisee a temperature 
ambiante, pendant 30 minutes, dans de I'eau ultra-pure appliquee a titre 
d'eluant a un debit de 0,5 mi/min. La detection a ete accomplie par 
refractometrie. 

20 De telles conditions ont permis de separer les especes 

suivantes : fructose, maltose, leucrose, saccharose, ainsi que les oligosides 
dont le degre de polymerisation ne depassait pas 6. 
Cajcuj des rendements : 

La methode de calcul des rendements des reactions de 
25 synthese d'oligosides a pris en compte la concentration residuelle 

d'accepteur, conformement a la formule suivante : 

R = {[GOS finaux] - [GOS initiaux]} / {0,474 x [saccharose consomme] + 
[accepteur consomme]} 

ou R represente le rendement reel de la reaction de synthese des GOS 
30 totaux, les concentrations etant exprimees en g/I. 
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Construction des diffe rentes formes deletees de la 
proteine DSR-E : 

Les differentes formes deletees de la proteine DSR-E [Figure 
1c) a 1i)] ont ete obtenues par amplification par PCR des fragments 
correspondants du gene dsrE, puis clonage dans le vecteur pBAD-TOPO 
Thiofusion, dont la description est fournie supra. Les amorces utilisees pour 
^amplification des regions selection.nees a partir du gene dsrE sont listees 
dans le tableau II suivant. Les positions des amorces sont indiquees en 
reference a la sequence ID no. 5, relative a la sequence du gene dsrE. Les 
bases mutees afin d'introduire le site de restriction Nco\ sont en caracteres 
gras et le site A/col resultant est souligne. 

TABLEAU II : 



Designation 



Positions 



Sequence 5'-3' 



4r 



pBAD-PS/ZV-dir 

pBAD-ZV/CD1-dir 

pBAD-CD1/GBD-dir 

pBAD-GBD/CD2-dir 

pB AD-C D 1 /G B D-in v 

pBAD-GBD/CD2-inv 

pBAD-ent-inv 



344-373 " ^ GCCATGGCA^TACGATTGCAGTTGACACG^ 
97 1 -1 001 GCCATGGACGGTAAAACCTATTTTCTTGAcW" 

3656-3682 ' T CC ATG G G TG AAAAAAC AAG C AC C G G C 
6 1 67-6 1 89 ACCATGG ATATGTCTACTAATGC 
3638-3658 TAACTGTTTAGGCAAGAATCC 
6 1 46-6 1 72 TAATGTATTAGTGAATAAGTATTCACC 
8714-8737 AATTTGAGGTAATGTTGATTTATC 



Les amorces directes et inverses ci-dessus ont ete dessinees 
de maniere a assurer la fusion traductionnelle de Tetiquette thioredoxine en 
N4erminal et Tetiquette polyhistidine en C-terminai des formes proteiques 
itronquees en respectant les cadres ouverts de lecture des regions codant 
lesdites formes. * > - # > 

- . '* Dans la mesure ou le plasmide' pBAD-TOPO* Thiofusion 
contient un site de restriction specifique de I'enzyme Nco\ situe au niveau 
de Textremite 5' de la region codant la thioredoxine, un deuxieme site Nco\ 
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a ete introduit dans chaque amorce directe afin de pouvoir, le cas echeant, 
extraire ladite region. 

Les reactions d'amplification par PCR ont ete realisees a 
Taide du systeme « Expand Long Template » dans les conditions 
5 suivantes : une pre-denaturation a 94 °C pendant 3 minutes, suivie de 25 

cycles a 94 °C pendant 30 secondes, 52 °C pendant 30 secondes et 68 °C 
pendant 7 minutes. 

Les produits d'amplification ainsi generes ont ensuite ete 
clones dans le vecteur pBAD-TOPO Thiofusion aux fins de la 
10 transformation subsequente de la souche E. coli TOP 10. Des clones 

recombinants ont ete selectionnes, leur profit de restriction analyse afin 
d'identifier, pour chacune des formes recherchees, un plasmide 
recombinant portant ('insertion orientee comme attendu. 

Exemple 1 : Caracterisation et purification de I'enzyme 
I 5 DSR-E et obtention du gene dsrE 

Les enzymes produites par les cultures de L mesenteroides 
et obtenues sur gel de polyacrylarnide en SDS tel que decrit dans la partie 
Materiels et Methodes ont ete isolees par decoupe du gel. 

Les GOS produits par les enzymes ainsi isolees ont ete 
20 analyses par HPLC selon les methodes decrites dans (1). L'enzyme dont 

I'activite etait recherchee a ete deduite de la nature des GOS produits. 
Apres proteolyse trypsique et separation par HPLC des peptides produits, 2 
peptides : 29- FYFESGK et 24- FESQNNNP ont ete sequences et utilises 
comme modele pour la synthese d'amorces nucleotidiques degenerees. 
25 Les differentes etapes d'amplification et de clonage sont 

representees dans la figure 2. Le gene complet a ete insere dans ie 
plasmide pCR-T7-E et exprime dans E. coli. 

La production d'une enzyme fonctionnelle est attestee par la 
production des GOS dont I'analyse HPLC est representee dans la 
30 figure 6b). 
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On remarquera en particuiier ('importance des pics 5 et 7 
representatifs des GOS a ramification a(1^2). 

Exempfe 2 : caracterisation des sequences de dsrE et 

DSR-E 

. : ■.. 2.1 Sequence nucleotidique : 

-La sequence nucleotidique de Tenzyme est representee dans 
la sequence ID No. 4. Elle est composee d'un cadre de lecture de 
8506 nucleotides. 

La sequence nucleotidique de Tinsert dans le plasmide pCR- 
v T7~dsrE contient un site de liaison au ribosome (RBS), 9 bases en amont 
du codon d'initiation ATG et est composee d'un hexa-nucleotide GAGGAA. 

2.2 Analyse de la sequence d'amino-acides :" 

La sequence de 8506 nucleotides de dsrE code une proteine 
de 2835 acides amines representee dans la sequence ID No. 2. Le pdiht 
isolectrique de cette proteine est de 4,88 et son poids moleculaire theorique 
de 313,2 kDa. En depit des fortes similarites .< avec les dextrane- 
saccharases deja connues, DSR-E est caracterisee par une structifre 
originale. ' -i :« ^ 

L'alignement de la sequence d'amino-acides avec Tensemble 
des glycosyltransferases et des dextrane-saccharases connues confirme 
que la structure en domaine des glycosyltransferases et des dextrane- 
saccharases est conservee, a savoir : une sequence signal, une region 
variable, un domaine catalytique hautement conserve et un domaine de 
liaison au glucane. Cette structure est representee dans la figure 1a). 
: . Comme rindique. la figure 1b); : un deuxieme domaine - 

catalytique forme la partie carboxy-terminale de I'enzyme comme cela ete 
confirme par PRODOM et une analyse Blast. . . - . - . 
<\ . Avec un poids. moleculaire de 313,2 kDa, DSR-E a environ 
2 fois. le poids moleculaire moyen des. autres glycosyltransferases et 
dextrane-saccharases (1), ce qui est en accord avec la presence d'un ' 
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deuxieme domaine catalytique a I'extremite C-terrninale et egalement avec 
un domaine de liaison au glucane plus long. 

a) analyse de la sequence signal : 

La sequence signal et la sequence nucleotidique codant le 
peptide signal sont extremement conservees si on les compare aux autres 
dextrane-saccharases comme ceci est indique dans la figure 3. Le site de 
clivage est localise entre les acides amines 40 et 41 . 

b) domaine variable : 

En aval du peptide signal, DSR-E a un domaine variable de 
207 acides amines. Lorsqu'on le compare aux autres domaines variables 
des glycosyltransferases, en utilisant un programme d'aiignement de type 
SAPS, on met en evidence la presence d'un motif de 14 acides amines 
repete 1 1 fois comme ceci est indique dans la figure 4. 

Ce motif repete, riche en alanine, threonine et acide 
aspartique n l a jamais ete identifies precedemment. 

Le role et la signification de cette region n'ont jamais ete 
elucides. Differentes etudes ont demontre que sa deletion n'affecte pas 
I'activite enzymatique (4). Le role du motif repete de 14 acides amines qui 
n'existe pas dans les autres glycosyltransferases reste neanmoins a 
determiner. 

c) analyse des domaines catalvtiaues : 

Le premier domaine catalytique s'etend des acides amines 
248 a 1142 (CD1) de la sequence ID No. 2, alors que le deuxieme est 
localise entre les acides amines 1980 et 2836 (CD2). Ces deux domaines 
presentent 45 % d'identite et 65 % de similarity entre eux. 

CD1 et CD2 contiennent les acides amines deja identifies 
dans les glycosyltransferases et les dextrane-saccharases comme etant 
essentiels a leur activite enzymatique, et comme ceci est indique dans la 
figure 5. 

Les triades catalytiques de CD1 et CD2 determinees par 
analogie avec Ta amylase (7) sont presentes aux positions suivantes : 
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(Asp 527/Glu 565/Asp 638 pour CD1 et Asp 2210/Glu 2248/Asp 2322 pour 
CD2). 

D'autres residus conserves ont ete identifies comme 
importants pour I'activite enzymatique : les residus Trp 425/Glu 430 pour 
CD1 et Trp 2122/Glu 2127 pour CD2, lesquels spnt analogues.acelles du 
domaine N-terminal de GFTI decrits par Monchois et al. {A) :>Trp 344/Glu 
349. • , 

En revanche, certaines sequences situees dans la region 
conservee des glycosyltransferases et des dextrane-saccha rases ne se 
retrouvent pas dans CD2 de DSR-E. Ainsi, comme indique dans la figure 5. 
ci-dessous, les sequences FIHNDTI (2214-2220) et KGVQEKV (2323- 
.2329). divergent des autres sequences consensus des dextrane- 
saccharases deja etudiees qui sont . respectivement . t NVDADLL et 
SEVQTVI. . - >. , 

d) domaine de liaison au glucane :•■ ^ .\ t , « ^ >: 
4 • Lorsque Ton compare la sequence de DSR-E avec les 
sequences connues, il apparaTt que le domaine de liaison au. glucane est 
sensiblement plus long. En effet, ce domaine a une longueur d'emviron 
.500. acides amines dans les glycosyltransferases et les dextrane- 
saccharases etudiees alors que dans DSR-E, il represente 836 acides 
amines. Plusieurs motifs repetes A et C et, en particulier, une serie de 
repetitions AC ont pu etre identifies. Dans le Tableau III suivant, sont 
indiquees les sequences consensus des motifs . repetes du GBD, 
notamment des motifs A et C, decrits dans la litterature relativement a des 
dextrane-saccharases de Leuconostoc et Streptococcus spp. . 
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TABLEAU ill : 
Motif Sequence consensus 

"A WWYFNxDGQAATGLQTIDGQTVFDDNGxQVKG 

B VNGKTYYFGSDGTAQTQANPKGQTFKDGSGVLRFYNLEGQYVSGSGWY 
C DGKIYFFDPDSGEWKNRFV 
D GGWKNADGTYSKY 
N YYFxAxQGxxxL 
x : acide amine indifferent. 

5 Exemple 3 : expression de dsrE chez E. col's 

Des cellules de E. coli BL21 (DE3) pLysS pCR-T7-dsrE ont 
ete cultivees comme decrit ci-dessus. Apres gel d'electrophorese en 
polyacrylamide-(page-SDS) ('analyse des extraits proteiques a revele 
effectivement la presence de plusieurs bandes ayant I'activite de dextrane 
10 saccharase, ladite activite etant mesuree comme ci-dessus. 

La lignee E. coli JM109 [pCR-T7-ds/D] a ete deposee a la 
CNCM ie 15 mars 2001 sous le numero I-2649. 

Identification et caracterisation de Tactivite enzymatique : 

En utilisant une molecule accepteur de glucose, les dextrane- 
15 saccharases produites par E. coli recombinant ont ete comparees avec 

celles produites par L mesenteroides NRRL B-1299. 

L'analyse HPLC des produits de la reaction avec la DSR-E 
recombinante montre (figure 6) des temps de retention correspondant aux 
GOS prealablement identifies R4 et R5 (2). Les oligosaccharides de type R 
20 sont les series de GOS lineaires, le lien a(1->2) etant lie a I'extremite non- 

reductrice. La serie OD, GOS lineaires resultant de liens glycosidiques 
a(1->6) avec un residu maltose a I'extremite reductrice, a ete observee en 
tres faibles quantites. Trois nouveaux composes sont en revanche detectes 
dans les produits de I'enzyme recombinante. 



25 
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Identification des GOS produits 

Finalement, la figure 6b montre clairement que les pics 5 et 7 
representant les GOS de la serie R sont relativement plus importants avec 
I'enzyme recombinante qu'avec I'enzyme native dont les pics 
correspondant au panose et a OD5 sont plus importants. 

Exemple 4 : Effet de la deletion de CD2 sur I'activite 
enzymatique de DSR-E 

L'ADN genomique de L. mesenteroides NRRL B-1299 a ete 
utilise comme matrice pour amplifier par PCR le gene dsrE delete de la 
sequence correspondant au second domaine catalytique. Pour cela, 
2 oligonucleotides, ECHO-dir 

(S'-AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG) 
(SEQ. ID No. 6), correspondant a la sequence nucleotidique -6 a 39 et 
contenant le codon d'initiation de la traduction, et ECHO-inv-del (5'- 
GTATTAGTGAATAAGTATTCACCATTGCATTTATCGTCAAAATAGTACG) 
(SEQ. ID No. 7) complementaire de la sequence 5889-5937 et 
correspondant a la sequence peptidique YYFDDKGNGEYCFTNT, ont ete 
synthetises, afin de fusionner I'extremite C-terminale de la proteine deletee 
avec un tag His. present sur le vecteur de clonage. La reaction PCR a ete 
realisee grace a un DNA thermal cycler model 2400 (Perkin-Elmer), avec le 
systeme Expand Long Template System (Boehringer Mannheim), suivant le 
cycle de temperature : 94°C pendant 3 min, puis 25 cycles avec : 30 s a 
94°C, 30s a 55°C et 7 min a 68°C. Le produit PCR a ensuite ete clone dans 
le vecteur donneur pUNI, et le plasmide resultant, utilise dans une reaction 
de recombinaison avec le vecteur d'expression pCR-T7-AcfcAE. 

La preparation des extraits cellulaires, les reactions 
enzymatiques, Tanalyse des produits de la reaction sont les memes que 
dans I'exemple 3 ci-dessus. • * •* ' 

. .. Le profil HPLC des GOS obtenus avec Tenzym'e DSR-E 
deletee du domaine CD2 apparait dans la figure 6 c). • ; - - ^ : • ; ' L 
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Les GOS de type R, represents par les pics 5 et 7 visibles 
dans la figure 6 a) et 6 b) sont totalement absents des produits obtenus 
avec I'enzyme recombinante deletee de CD2. Les seuls produits 
analysables sont ceux correspondant a des oligosides lineaires resultant de 
liens a(1 -> 6) avec un residu maltose dans la partie reductrice. Ce resultat 
indique clairement le role essentiel du domaine catalytique situe dans la 
partie carboxy-terminale de I'enzyme dans sa capacite a former des 

liaisons osidiques a(1 2). 

Exemple 5 : etude des relations structure-fonction de la 

proteine DSR-E 

Le gene dsrE, en ce qu'il est le premier gene codant une 
dextrane-saccharase catalysant la synthese de liaisons a(1 -*2) a avoir ete 
clone, revet un interet particulier. II est done important de caracteriser ce 
gene ainsi que son produit d'expression, en I'occurrence en determinant 
quelle est I'implication des differents domaines composant la proteine DSR- 
E dans la fonction qui lui a ete assignee, a savoir de correspondre a une 
dextrane-saccharase specifique de la synthese de liaisons a(1->2). 
5.1 Formes deletees de la proteine DSR-E : 
L'etude de six formes differentes obtenues par deletion d'un 
ou de plusieurs domaines de la proteine DSR-E a ete envisagee afin de 
determiner, en reference a la Figure 1 ci-dessous : (i) I'influence de la 
presence du domaine CD2 en etudiant les constructions GBD-CD2 et 
A(CD2) ; (ii) I'influence de la presence de la zone variable en analysant les 
formes A(ZV) et CD1-GBD ; et (iii) le potentiel catalytique intrinseque des 
domaines CD1 et CD2 exprimes de fa?on isolee (constructions CD1 et 
CD2). 

L'activite catalytique de chacune des differentes formes a ete 
comparee a celle observee avec le controle correspondant a la forme 
entiere deletee du seul peptide signal A(PS) [Figure 1c)]. 
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5.2 Analyse des constructions : 

A Tissue de la procedure experimental d'amplification par 
PCR et de clonage detaillee supra, plusieurs clones presentant une 
insertion selon ('orientation escomptee ont ete obtenus pour chacune des 
constructions envisagees, a Texception de la forme tronquee GBD-CD2 
pour laquelle le produit d'amplification souhaite n'a pu etreclone. 

Les sequences des insertions ont ete determinees afin de 
s'assurer de Tabsence de mutations susceptibles de modifier, apres 
traduction, des acides amines situes au niveau de positions presumees 
essentielles pour Tactivite enzymatique de la proteine ainsi codee. • 
. . . Une mutation a ete identifiee au niveau de la 31 6me base de 

Tinsertion relative au controle A(PS), induisant la substitution d'un acide 
aspartique par une asparagine en position 10 de la zone variable. N'etant 
pas .situee au niveau des motifs repetes S de la zone variable (Figure 4)^ il 
sembjerait que I'.incidence de. cette mutation sur la .fonction .finalemeht 
observee soit negligeable. - - t . r j 

Une mutation a ete introduite dans le produit d'amplification 
correspondant a la construction A(CD2), modifiant le residu aromatiqCje 
F1411 en leucine. Cette mutation est situee dans le premier tiers du 
domaine de liaison au glucane GBD, au niveau d'une jonction entre deux 
motifs repetes. 

La construction A(ZV), eu egard aux erreurs effectuees par la 
polymerase lors de la reaction d'amplification par PGR, ne presentait pas la 
sequence attendue. En effet, Tinsertion contenait un- cadre ouvert de 
.lecture, ledit cadre correspondant pour Tessentiel a la forme GBD-CD2 qui 
n'avait pu etre donee. Cependant, dans la forme GBD-CD2 obtenue en 
definitive a la place de A(ZV), les 46 residus N-terminaux etaient absents. 
Or, le domaine GBD compte plus de 800 . acides amines form.ant un 
enchainement de 24 unites repetees. Cet enchainement est tel que, sur les 
46 residus tronques, seuls les 9 derniers etaient situes au niveau de Tune 
desdites unites, et en particulier au niveau de la premiere d'entre elles. II 
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paraissait en consequence plausible de considerer que la deletion de ces 
acides amines etait sans influence sur la reaction enzymatique catalysee 
par la forme proteique correspondante. Cette hypothese etait d'autant plus 
vraisemblable qu'il a ete montre sur d'autres dextrane-saccharases, que la 
5 perte d'un certain nombre d'unites repetees du domaine GBD ne reduisait 

pas I'activite de la proteine resultante de maniere significative (8). 

L'insertion codant la forme CD1-GBD contenait une mutation 
affectant le residu F633, situe dans le domaine CD1, et plus precisement, 
au niveau d'une region fortement conservee parmi les dextrane- 

10 saccharases, elle-meme localisee juste avant le deuxieme acide aspartique 

de la triade catalytique (Figure 5). La phenylalanine attendue etait 
substitute par une leucine. II est difficile, a ce stade, d'estimer Timpact 
d'une telle mutation sur I'activite catalytique observee. 

De la meme maniere que pour les autres constructions, la 

15 sequence des insertions codant les domaines catalytiques CD1 et CD2 

isoles est determinee. 

5.3 Produits d'expression et activites enzymatiques : 
Les proteines correspondant aux diverses formes deletees de 
DSR-E ont ete exprimees en soumettant les cellules recombinantes de E. 

20 coli a une induction par le L-arabinose selon une concentration de 0,002 %. 

L'activite enzymatique a ete observee pendant les quatre premieres heures 
qui suivaient reduction. 

Les extraits proteiques obtenus par sonication des culots 
celiulaires ont ete analyses en electrophorese SDS-PAGE (Sambrook et 

25 Russel, 2001, supra). Les masses moleculaires des proteines 

recombinantes ont ete estimees a partir des profils electrophoretiques 
obtenus, lesdites masses correspondant pour I'essentiel aux masses 
attendues, en tenant compte de Pincrementation de 12 kDa Nee a ('etiquette 
thioredoxine. Le Tableau IV ci-apres resume les valeurs estimees des 

30 masses moleculaires des differentes formes tronquees et fournit, a titre de 

comparaison, les masses attendues. 
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TABLEAU IV : 



Forme proteique 


Masse attendue 
(kDa) 


Masse attendue + 
thioredoxine (kDa) 


Masse estimee 
(kDa) 


A(PS) ' 


' 309 


321 


324 


A(CD2) • ' • 


218 


230 


' ND 


GBD-CD2 


• 224- 




233 


CD1-GBD 


193 


205 


199 


CD1 


99 


.111 


111 


CD2 


95 


107 


ND 



ND : non determine. 



Dans le Tableau V suivant, sont indiquees la nature et^ia 
position des acides amines marquant le debut et la fin des formes 
proteiques construites .dans le cadre de cette etude.^ Les differenfes 
positions font reference a la sequence ID no. 2 correspondent a la proteine 
DSR-E. . , ^ 

TABLEAU V : 



Forme proteique 


Acide amine de 
debut 


Acide amine de fin Longueur totale 


A(PS) 


N41 


I2835 


2795- : /■ 


A(CD2) 


M1 


L1980 


1980 . 


GBD-CD2 


..Ml 188. 


I2835 


1648 


CD1-GBD 


I248 


L1980 


. 1733 


CD1 . . 


I248 


Q1141 


894 ■ 


CD2 


D1981 


I2835 


855 



La forme GBD-CD2 ne possedait pas Tetiquette thioredoxine. 
En effet, cette forme etait issue des aleas experimentaux occasionnes par 
la procedure d/amplification par PCR de la sequence censee coder la forme 
A(ZV). Eu egard aux deletions de sequences alors generees, I'etiquette 
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thioredoxine, en principe situee en 5' de la proteine d'interet, n'avait pu etre 
fusionnee avec la region GBD-CD2. 

La qualite des gels d'electrophorese n'a pas permis de 
determiner si le niveau d'expression des differentes formes eta it 
5 quantitativement identique et, en consequence, si lesdites formes etaient 

presentes dans les memes proportions dans les extraits cellulaires. 

Aussi les mesures d'activite fournies ont ete etablies sur la 
base d'un volume donne d'extraits cellulaires, mais n'ont pu etre ramenees 
a la quantite de chaque proteine reeliement contenue dans ledit volume 
10 d'extraits. 

La synthese de polymeres de dextrane in situ par incubation 
des gels d'electrophorese dans une solution de saccharose, et la coloration 
au reactif de Schiff subsequente ont confirme la presence de proteines 
possedant une activite glucane-saccharase dans les extraits cellulaires 

15 correspondant a A(PS), A(CD2), GBD-CD2 et CD1-GBD. 

Dans le Tableau VI ci-dessous, sont presentees les activites 
enzymatiques maximales observees pour chaque construction. Les 
resultats ont confirme les donnees tirees des experiences de coloration des 
gels au reactif de Schiff, a savoir le fait que les extraits cellulaires relatifs 

20 aux formes A(PS), A(CD2), GBD-CD2 et CD1-GBD presentaient une 

activite saccharase, a Tinverse des deux domaines catalytiques pris 
isolement Ce resultat etait conforme a la litterature, etant donne qu'il avait 
ete montre pour d'autres dextrane-saccharases, que I'absence du domaine 
GBD induisait une perte d'activite enzymatique drastique (8, 9, 10). 

25 

TABLEAU VI : 



Forme 
proteique 


A(PS) 


A(CD2) 


GBD-CD2 


CD1-GBD 


CD1 


CD2 


Activite 

maximale 

(U/l) 


1063 


181 


86 


235 


5,3 


0 
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La forme CD1 possedait une activite intrinseque de niveau 
suffisant pour etre detectee. Quant a la forme GBD-CD2, elle presentait un 
niveau d'activite . non negligeable, dont on pouvait conclure que 
('organisation structurale correspondante, a savoir un domainecatalytique 
en aval du domaine de liaison au glucane, demeuraitenzymatiquement 
active. /:\. * * 

. . 5.4 Effets des deletions sur la synthese d'oliqosides : 

Dans la mesure ou la specificite de synthese des liaisons 
a(1->2) est conservee lors de la reaction en presence d'un accepteur, des 
experiences de synthese d'oligosides a partir de maltose ont d'abord ete 
effectuees (Figure 7). > 

Lorsque les reactions ont ete menees a leur terme, c'es?-a- 

, dire lorsque; tout . le saccharose a ete consomme, les rendements^cie 
synthese en oligosides ont ete calcules.,Les resultats apparaissent dans'le 

fc Tableau VII suivant. Seule la reaction impliquant I'extrait cellulaire 
contenant la forme proteique CD1 n'a pu permettre un tel calcul. L'effet-de 
la temperature a probablement conduit a I'inactivation de la tres fai&le 
activite presente dans I'extrait proteique. : * h 

TABLEAU VII : 



Forme proteique Rendement en Rendement en Rendement en 

oligosides de la serie oligosides de la serie • oligosides totaux 



OP (%) R (°/c 

Enzyme native 36 28 64 

A(PS) 41 14 . . 55 

ACD2) 4 . 67 1 .68 

GBD-CD2 ! ' * 45 47 . \ g2 

" CD1-GBD 100 0 100 
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Comme indique sur la Figure 7 ci-dessous, la presence 
d'oligosides de la serie R n'etait decelee qu'avec les formes enzymatiques 
possedant le domaine catalytique CD2, a I'exception du cas ou ledit 
domaine etait isole et alors rendu completement inactif. En effet, les temps 
de retention des oligosides synthetises par la forme deletee du deuxieme 
domaine catalytique, ainsi que par la forme CD1-GBD, correspondaient 
uniquement a ceux de la serie OD, c'est a dire aux GOS depourvus de 
liaisons a(1-»2). Ces resultats indiquaient done que le domaine CD2 etait 
requis pour la formation des liaisons a(1->2). 

Les produits obtenus avec la forme GBD-CD2 ont permis 
d'etayer ces observations. Cette construction, qui possedait CD2 comme 
seul domaine catalytique, etait capable de catalyser de maniere 
preponderate la synthese d'oligosides de la serie R, possedant des 
liaisons ot(1->2). Ce resultat demontrait done que la specificite en terme de 
fonction de I'enzyme DSR-E reside dans la sequence tres originate de ce 
domaine, et non pas dans ('association de deux domaines catalytiques. En 
outre, la forme proteique GBD-CD2 permettait egaiement la synthese de 
liaisons oc(1->6). Toutefois, les faibles rendements obtenus pour ces 
oligosides indiquaient qu'ils etaient preferentiellement convertis en 
oligosides de degre de polymerisation superieur appartenant a la serie R, 
ce qui empechait leur accumulation dans le milieu reactionnel, a la 
difference des molecules de la serie R qui, elles, n'etaient pas converties 
(2). 

En comparant les profils des produits obtenus, tels que 
montres a la Figure 7, il est apparu que la forme entiere A(PS) synthetisait 
majoritairement des oligosides lineaires. En effet, la molecule R4 etait 
absente et I'oligoside R5 faiblement present. Le domaine catalytique CD1 
perme ttait, quant a lui, de catalyser la synthese exclusive de liaisons 
a(1^6) et son activite semblait preponderate par rapport a celle du 
domaine CD2. Aussi, dans la forme entiere de I'enzyme, I'implication du 
domaine CD2 serait done moins importante du fait de : (i) parametres 
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catalytiques intrinseques plus faibles ; et/ou (ii) d'une configuration globale 
de I'enzyme defavorable a son activite. 

En outre, I'enzyme entiere A(PS) catalysait la synthese 
d'oligosides de la serie R avec un rendement inferieur a celui observe avec 
5 le melange de dextrane-saccharases produit par L mesenteroides NRRL 

B-1299 (Figure 7). Le rendement obtenu, de 28 %, etait situe entre ceux 
observes avec la forme entiere A(PS) d'une part, et la; forme GBD-CD2 
d'autre part. Or, Ton sait que la souche sauvage produit plusieurs formes 
de dextrane-saccharases susceptibles de synthetiser des liaisons 
10 i - osidiques, et notamment des liaisons a(1->2). Line hypothese avait ete 
emise, selon laquelle lesdites formes etaient des produits de degradation 
: de DSR-E. Ainsi, dans la mesure ou des formes tronquees de DSR-E, 
telles GBD-CD2, pouvaient catalyser la synthese d'oligosides de la serie R 
- -plus efficacement, il: sembierait que les rendements obtenus avec Me 
IS- , melange heterogene produit par L mesenteroides NRRL B-1299 sdienf 
i : imputables a la contribution des activites catalytiques de Tensemble de ces 

differentes formes enzymatiques. . ** 

: En conclusion, les inventeurs ont reussi, en isolant une dextrane 

saccharase particuliere produite par L. mesenteroides, a caracteriser une 
20 < - structure particuliere et inattendue de cette enzyme apte a. produire des ■ 
oligosides d'interet. et presentant des ramifications de type a(1->2). 
L'identification et la caracterisation de cette sequence permettent d'une part 
de construire des cellules ou organismes recombinants exprimant de fapon 
specifique cette enzyme et, d'autre part, d'en envisager sa modification par 
25 . * mutagenese dirigee ou aleatoire ou par evolution moleculaire* (DNA ' 
Shuffling) afin d f en ameliorer encore ses caracteristiques. . : • 
~* j t Cette invention permet en outre d'ameliorer le, rendement et la 

.-• reproductibilite de la production des GOS d'interet pour les differentes 
. applications citees ci-avant. * : , . 
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REVENDICATIONS 

1. Polypeptide isole ayant une activite enzymatique de 
glycosyltransferase apte a former des dextranes presentant des 
ramifications a(1 2) a partir de saccharose, d'a-D-fluoro-glucose, de 
para-nitrophenyl-a-D-glucopyranoside, d'a-D-glucopyranoside-aD- 
sorbofurano-side ou de 4-O-aD-galactopyranosylsucrose, caracterise en ce 
qu'il comprend au moins un domaine de liaison au glucane et un domaine a 
activite catalytique situe en aval du domaine de liaison au glucane. 

2. Polypeptide selon la revendication 1 comprenant au moins 
deux domaines catalytiques situes de part et d'autre du domaine de liaison 
au glucane. 

3. Polypeptide selon la revendication 1 ou 2 comprenant un 
peptide signal, une region variable, deux domaines catalytiques et un 
domaine de liaison au glucane situe entre les deux domaines catalytiques. 

4. Polypeptide selon I'une des revendications 1 a 3 dans 
lequel le ou les domaine(s) a activite catalytique a (ont) un pourcentage de 
similarity compris entre 65 % et 100 % avec la SEQ. ID n°1. 

5. Polypeptide selon I'une des revendications precedentes 
dans lequel la faille du domaine de liaison au glucane est superieure a 
500 aminoacides. 

6. Polypeptide selon la revendication 5 ayant la SEQ. ID n°2. 

7. Polypeptide selon la revendication 6 modifie par 
substitution, insertion, deletion de sequences d'acides amines et 
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comportant des sequences presentant au moins 80 % et de preference au 
moins 90 % de similarite avec les sequences suivantes de la sequence ID 

n° 2 : 

423- 439 (SEQ. ID n° 6) 2120 - 2138 (SEQ. ID n° 12) 

478-501 (SEQ. ID n° 7) 2161 -2184 (SEQ. IDnM3) 

519-539 (SEQ. ID n° 8) • 2202 - 2214 (SEQ. ;ID n° 14) 

560 - 571. (SEQ. ID n° 9) 2243 - 2250 (SEQ.. ID n° 15) 

631 -645 (SEQ. ID n° 10) 2315-2322 (SEQ. ID ,n° 16) 

1014 - 1021 (SEQ ID n° 11) 2689 - 2696 (SEQ. ID n° 17) 

8. Polypeptide selon la revendication 7 dans lequel les acides 
amines suivants sont inchanges : ^ 
W en positions 425 et 2122, . ,. . ;W 

E en positions 430, 565 et 2127, 2248, ;?' 
D en positions 487, 489, 527, 638, 2170, 2172, 2210 et 

2322,. . 

. . . H en position 637 et 2321, . .. 

Qen position 1019 et 2694. . i : 

.9. Acide nucleique isole codant une enzyme a activite 
glycosyltransferase apte a. former des dextranes presentant des 
ramifications oc(1 2) a partir de saccharose, d'a-D-fluoro-glucose, de 
para-nitrophenyl-a-D-glucopyranoside, d'a-D-glucopyranoside-aD- 
sorbofurano-side , pu de 4-O-a-D-galactopyranosylsucrose, et 
cornprenant au moins une sequence nucleotidique codant un' domaine 
catalytique ayant au moins 50 % t et de preference au moins 80 %' cTidentite 
avec la sequence ID n° 3, et situe en 3' d'une sequence codant un domaine 
de liaison au glucane: - .... .. 



1 er depot 



51 

10. Acide nucleique selon la revendication 9 comprenant : 

a) deux sequences codant des domaines catalytiques ayant 
au moins 50 %, et de preference au moins 80 % d'identite avec la 

sequence ID n° 3 ; 

b) une sequence codant le domaine de liaison au glucane, ce 
dernier etant situe de preference entre les deux sequences en a). 

11. Acide nucleique isole selon la revendication 10 presentant 
au moins 80 % d'identite avec 

a) la sequence ID n° 4 ou ; 

b) le brin complementaire de la sequence en a), ou 

c) une sequence hybridant a) ou b) en conditions stringentes. 

12. Acide nucleique isole selon la revendication 11 constitue 
de la sequence ID n° 4 ou son brin complementaire ou de la sequence 
deduite de la degenerescence du code genetique. 

13. Acide nucleique isole selon la revendication 1 1 

comprenant : 

a) une sequence ayant au moins 80 % d'identite avec la 
sequence codant une dextrane saccharase exprimee par le plasmide pCR- 
T7-dsrO depose a la CNCM le 15 mars 2001 sous le numero I-2649, ou 

b) une sequence complementaire de la sequence en a). 

14. Vecteur d'expression comprenant un acide nucleique 
selon Tune quelconque des revendications 9 a 13. 

15. Vecteur selon la revendication 14 dans lequel I'acide 
nucleique est sous le controle de sequence permettant son expression 
dans des cellules procaryotes ou eucaryotes. 
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16. Cellule hote transformee par un acide nucleique selon 
Tune des revendications 9 a 13 ou un vecteur selon Tune des 
revendications 14 a 15. 

17. Cellule transformee selon la revendication 16 choisie dans 
un groupe- comprenant E. coli, les Leuconostoc, les vegetaux, les 
Lactococcus et les Bacillus ou les levures. 

18 cellule transformee selon la revendication 17 caracterisee 
en ce qu'il s'agit d'une souche de £. coli deposee a la CNCM le 
15 mars 2001 sous le n° i-2649. 

19. Procede de production d'une dextrane saccharase apte a 
former des liaisons a1 ~* 2 comprenant : ^ 

a) Tinsertion d'un acide nucleique r selon Tune r des 
revendications 9 a 13 ou un vecteur selon Tune des revendications 14 a 15 
dans une cellule hote selon la revendication 16; 

b) la purification de I'enzyme a partir d'un extrait cellulaire r 

20. Procede selon la revendication 19 dans lequel la cellule 
hote est un procaryote choisi dans un groupe comprenant. E: coli, les 
Lactococci, les Bacillus, les Leuconostoc. 

21. Procede selon la revendication 19 dans lequel la cellule 
hote .est un eucaryote choisi dans un groupe comprenant les levures, les ' 
champignons, les vegetaux. . v . - - 

v _ ; 22. Procede, d'obtention d'une .dextrane saccharase apte a 
former des. oligosides ou des dextranes presentant un taux : de liaison 
a(1 2) superieur a 30 % des liaisons totales comprenant une-etape de 
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modification de la sequence ID n° 4 par addition, deletion, mutation a partir 

du moment ou : 

- le cadre de lecture n'est pas modifie, et 

- les acides amines suivants sont conserves apres traduction : 

W en positions 425 ou 2122, code par le triplet TGG en 
positions 1273 et 6364, 

E en positions 430, 565, 2127 et 2248 codes par les 
triplets GAA en positions 1288, 1693, 6379 et 6742 
respectivement, 

D en positions 487, 489, 527, 638, 2170 et 2210 codes par 
les triplets GAT en positions 1459, 1465, 1579, 1912, 
6508 et 6628 respectivement, 

D en positions 2172 et 2322 codes par les triplets GAT en 
positions 6514 et 6964, 

H en position 637 et 2321 , codes respectivement par les 
triplets CAT en position 1909 et CAC en position 6961, 
Q en positions 1019 et 2694 codes respectivement par les 
triplets CAA (3055) et CAG (8080). 

23. Precede d'obtention d'une glycosyltransferase isolee apte 
a former des oligosides ou des dextranes presentant un taux de liaison 
a(1 -» 2) superieur a 30 % comprenant : 

- une etape de modification aleatoire de la sequence ID n° 4 
et d'etablissement d'une banque de variants, 

- une etape d'expression de ces sequences modifiees dans 
une cellule note appropriee, un hote abritant un variant, 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 30 % de liaison a(1 -> 2) sur un substrat approprie, 

- une etape d'isolement du ou des genes ameliores. 
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24. Glycosyltransferase apte a former au moins 30 % de 
liaison a(1 -> 2) susceptible d'etre obtenue par un procede selon Tune des 
revendications 19 a 22. 

. . 25. Utilisation .d'une glycosyltransferase obtenue par un 
procede selon I'une des revendications 19 a 22 dans la fabrication d'une 
composition a effet.prebiotique. 

26. Utilisation d'une glycosyltransferase obtenue par un 
procede selon rupe^des revendications 19 a 23 dans la fabrication d'une 
composition pharmaceutique ou cosmetique.. 
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LISTE DE SEQUENCES 
<110> Centre National de la Recherche Scientifique 



<120> MOLECULE D 1 AC IDES NUCLEIQUES CODANT UNE 

DEXTRANE-SACCHARA.SE CATALYSANT LA SYNTHESE DE DEXTRANE 
PORT ANT DES RAMIFICATIONS DE TYPE ALPHA-1,2 OSIDIQUES 

<130> B4787A (INPI) CNRS/INSA TOULOUSE 

<14 0> XXXXXXX 

<141> 2001-12-19 

<150> 0103631 
<151> 2001-03-16 



<160> 17 

<170> Patentln Ver. 2.1 



<210> 1 
<211> 855 
<212> PRT 

<213> Acides amines (ciomaine catalytique n° 2) 

<400> 1 

Asp Met Ser Thr Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His 
1 5 10 .15 

Asp Ser Ser Ser Phe Asp His Thr Val Asp Gly Phe Leu Thr Ala Asp 
20 25 " 30 

Thr Trp Tyr Arg Pro Lys Ser lie Leu Ala Asn Gly Thr Thr Trp Arg 
35 40 45 

Asp Ser Thr Asp Lys Asp Met Arg Pro Leu lie Thr Val Trp Trp Pro 
50 55 60 

Asn Lys Asn Val Gin Val Asn Tyr Leu Asn Phe Met Lys Ala Asn Gly 
65 70 75 80 

Leu Leu Thr Thr Ala Ala Gin Tyr Thr Leu His Ser Asp Gin Tyr Asp 
85 90 95 

Leu Asn Gin Ala Ala Gin Asp Val Gin Val Ala He Glu Arg Arg He 
100 105 110 

Ala Ser Glu His Gly Thr Asp Trp Leu Gin Lys Leu Leu Phe Glu Ser 
115 120 125 

Gin Asn Asn Asn Pro Ser Phe Val Lys Gin Gin Phe He Trp Asn Lys 
130 135 140 

A.sp Ser Glu Tyr His Gly Gly Gly Asp Ala Trp Phe Gin Gly Gly Tyr 
145 150 155 160 
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Leu Lys Tyr Gly Asn Asn Pro Leu Thr Pro Thr Thr Asn Ser Asp Tyr 
165 170 175 

Arg Gin Pro Gly Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp 
180 185 190 

Asn Ser Asn Pro Val Val Gin Ala Glu Asn Leu Asn Trp Leu His Tyr 
195 200 205 

Leu Met Asn Phe. Gly Thr lie Thr Ala Gly Gin Asp t Asp Ala Asn Phe 
210 215 220* 

Asp Ser lie Arg lie Asp Ala Val Asp Phe lie His Asn Asp Thr lie 
225 230 235 240 

Gin Arg Thr Tyr Asp Tyr Leu Arg Asp Ala Tyr Gin Val Gin Gin Ser 
245 250 255 

Glu Ala Lys Ala Asn Gin His He Ser Leu Val Glu Ala Gly Leu Asp 
260 265 270 . 

Ala Gly Thr Ser Thr He His Asn Asp Ala Leu He Glu Ser Asn Leu 
275 280 285 

Arg Glu Ala Ala Thr Leu Ser Leu Thr Asn Glu Pro Gly Lys Asn Lys 
290 295 300 

Pro Leu Thr Asn Met Leu Gin Asp Val Asp Gly Gly Thr Leu He. Thr 
305 310 315 320 

Asp His Thr Gin Asn Ser -Thr. Glu Asn Gin Ala Thr Pro Asn Tyr - Ser, . 

325 330 • . 335 

He lie His Ala His Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala 
340 345 350' 

He Thr Asp Ala Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin 
355 360 365 

Leu Lys Ala Gly Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn - 
370 375 380 

Lys Lys Tyr Asn Ser Tyr Asn He Pro Ser He Tyr Ala Leu Met Leu. 
385 390 395 " 400 

Thr Asn Lys Asp Thr Val Pro Arg Met Tyr Tyr Gly Asp Met Tyr Gin 
405 410 415 

Asp Asp Gly Gin Tyr Met Ala Asn Lys Ser He Tyr Tyr Asp Ala Leu 
420 425 430 ' 

Val Ser Leu Met Thr Ala Arg Lys Ser Tyr Val Ser Gly Gly Gin Thr 
4 35 440 ' 4 45 * 

Met Ser Val Asp Asn His Gly Leu Leu Lys Ser Val Arg Phe Gly Lys 
4 50 4 55 ' 4 60 • 



Asp Ala Met Thr Ala Asn Asp Leu -Gly -Thr Ser Ala Thr Arg Thr Glu 
4 65 4 70 4 75 4 80 
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Gly Leu Gly Val 



Ser Asp Lys Val 
500 

Tyr Arg Ala Val 
515 

Ser Asp Gin Ala 
5 30 

Phe Ser Asn Gin 
545 

Val Ala Asn Pro 



Gly Ala Ser Asp 
580 

Asn His Asp Gly 
5 95 

Leu lie Tyr Glu 
610 

Asp Glu Leu Thr 
625 

Asn Trp Gly lie 



Gly Asp His Thr 
660 

Thr Asp Arg Tyr 
67 5 

Asp Gly Asp Leu 
690 

Gin Val Met Ala 
705 

Lys Glu Val Val 



Ala Thr Gly Phe 
740 

Gly Gin Tyr Gin 
755 

Ala Lys Tyr Pro 
770 

Lys Asn Tyr Ala 
785 



lie lie Gly Asn 
4 85 

Thr Leu Asp Met 



lie Leu Thr Thr 
520 

Pro Thr Ala Trp 
535 

Glu lie Asn Gly 
550 

Gin Val Ser Gly 
565 

Asn Gin Asp Ala 



Lys Val Leu His 
600 

Gly Phe Ser Asn 
615 

Asn Val Val He 
630 

Thr Ser Phe Glu 
645 

Phe Leu Asp Ser 



Asp Leu Gly Phe 
680 

Arg Ala Thr He 
695 

Asp Val Val Asp 
710 

Ser Ala Thr Arg 
725 

Gly Thr Gin Leu 



Glu Lys Tyr Ala 
760 

Asp Leu Phe Glu 
775 

Asn Asp Gly Ser 
790 



Asp Pro Lys Leu 
490 

Gly Ala Ala His 
505 

Arg Asp Gly Leu 



Thr Asn Asp Gin 
54 0 

Gin Asp Asn Thr 
555 

Tyr Leu Ala Val 
570 

Arg Thr Ala Ala 
585 

Ser Asn Ala Ala 



Phe Gin Pro Lys 
620 

Ala Lys Asn Ala 
635 

Met Ala Pro Gin 
650 

Thr He Asp Asn 
665 

Asn Thr Pro Thr 



Gin Ala Leu His 
700 

Asn Gin Val Tyr 
715 

Ala Gly Val Tyr 
730 

Tyr Val Thr Asn 
745 

Gly Gin Tyr Leu 



Gly Lys Ala Tyr 
780 

Asn Pro Tyr Tyr 
795 



Gin Leu Asn Asp 
495 

Lys Asn Gin Lys 
510 

Ala Thr Phe Asn 
525 

Gly Thr Leu Thr 



Gin He Arg Gly 
560 

Trp Val Pro Val 
575 

Thr Thr Thr Glu 

590 • 

Leu Asp Ser Asn 
605 

Ala Thr Thr His 



Asp Val Phe Asn 
640 

Tyr Arg Ser Ser 

. 655 

Gly Tyr Ala Phe 
670 

Lys Tyr Gly Thr 
685 

His Ala Asn Met 



Asn Leu Pro Gly 
720 

Gly Asn Asp Asp 
7 35 

Ser Val Gly Gly 
750 

Glu Ala Leu Lys 
7 65 

Asp Tyr Trp Tyr 



Thr Leu Ser His 

800 
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Gly Asp Arg Glu Ser . lie Pro Ala Asp Val. Ala lie Lys Gin Trp Ser 
805 810 815 

Ala Lys Tyr Met Asn Gly Thr Asn Val Leu Gly Asn Gly Met Gly Tyr 
820 ' 825 - 830 

Val Leu Lys Asp Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp 
835 840 845 

Lys Ser Thr Leu. Pro Gin lie, i? ... 

8 50 '8 55 



<210> 2 

<211> 2835 t ; 

<212> PRT 

<213> Acides amines (proteine complete DSR-E) 

<400> 2 . 
Met Arg Asp Met Arg Val lie Cys Asp Arg Lys Lys Leu Tyr Lys Ser 
1 5 ... 10 ~ 15 

Gly Lys Val Leu Val Thr Ala Gly lie Phe Ala Leu Met Met Phe Gly 

20 25 30 , .. • 

?•• • 

Val Thr Thr Ala Ser Val Ser Ala Asn Thr lie Ala Val Asp Thr Asn . / ■-. ' V 

35 - . . - . 45 . t . .... . . . . : : S% 

His Ser Arg Thr Ser Ala Gin lie Asn Lys Ser Ala Val Asp Lys Val > -.1 

50 . - 55, . : ■ 60. . - - ..... - . , .* . - 



Asn Asp Asp Lys Thr Thr Leu Gly Ala Ala Lys Val Val Ala Val Ala 

65 . 70- . .. 75 • 8.0 



Thr Thr Pro Ala Thr Pro Val Ala Asp Lys Thr Val Ser Ala Pro Ala . ; 

85 - 90 . . 95, ■ f ....... . ^ - . ±0- 

Ala Asp Lys Ala Val Asp Thr Thr Ser Ser Thr Thr Pro Ala Thr Asp 

100 . _ 105 110 : 

Lys Ala Val Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Val 

115 . . 120 125 ^ . • 

Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Val Asp Thr Thr 

130 135 . 140 

Pro Thr Thr Pro Ala Ala' Asn Lys Ala Val Asp Thr Thr Pro Ala Thr 

145 150 155 . , - ' 160 • 

Ala Ala Thr Asp Lys Ala Val Ala Thr Pro Ala Thr Pro Ala Ala Asp 

165 170 . 175 • . • . 

Lys Leu Ala Asn Thr Thr Pro Ala Thr Asp Lys Ala Val Ala Thr Thr 

180 - 185 ■ : - . t ■ - 190 • ■ . - . 

Pro Ala Thr 'Pro Val Ala Asn Lys Ala Ala Asp Thr Ser Ser lie His 

195 . . 200 . , . - - . 205 ... •• , ».'-..■ 

Asp Gin Pro Leu Asp Thr Asn Val Pro Thr Asp Lys Ser Ala Asn Leu 

210 215 220 
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Val Ser Thr Thr 
225 

Glu-Thr Ser His 



Asp Asn Gly Gin 
2 60 

Val Leu Tyr Phe 
275 

Gin Val Thr Lys 
290 

His Asp Leu Thr 
305 

Ala Asn Ser Trp 



Trp Thr Pro Thr 
340 

Trp Pro Asp Lys 
35 5 

Val Gly Met Leu 
370 

Ser Thr Leu Thr 
385 

Arg lie Gly Val 



Lys Leu lie Asp 
420 

Gly Asn Asp His 
435 

Lys Thr Pro Asn 
450 

Thr Asn Gin Thr 
465 

Glu Met Leu Leu 



Ala Glu Gin Leu 
500 

Ala Gin Asn Asp 
515 " 

Val Asp Asn Val 
530 



Gin Lys Ser Thr 
230 

Leu Gin Glu He 

245 

Val Lys Lys Asn 



Asp Lys Thr Ser 
280 

Gly Leu Val Asn 
2 95 

Ala Asp Asn Phe 
310 

Tyr Arg Pro Lys 
32 5 

Thr Ala Glu Asp 



Asn Thr Gin Val 
360 

Pro Asp Asp Val 
375 

Asp Ala Ala Met 

390 

Ser Gly Lys Thr 
405 

Ser Gin Ala Asn 



Leu Gin Gly Gly 
440 

Ala Asn Ser Asp 
455 

Gly Gin He Thr 
470 

Ala Asn Asp Val 
485 

Asn Trp Leu His 



Pro Thr Ala Asn 
520 

Asp Ala Asp Leu 

535 



Asp Asn Gin Gin 
235 

Asn Gly Lys Thr 
250 

Phe Thr Ala He 
265 

Gly Glu Leu Thr 



He Asp Asn Ala 
300 

Thr Asn Val Asp 
315 

Asp He Leu Lys 
330 

Phe Arg Pro Leu 
345 

Ala Tyr Leu Gin 



Lys Val Ser Asn 
380 

Thr Val Gin Lys 

395 

Asp Trp Leu Lys 
410 

Trp Asn lie Asp 
425 

Ala Leu Leu Tyr 



Tyr Arg Leu Leu 

460 

Asp Pro Ser Lys 
4 7 5 

Asp Asn Ser Asn 
490 

Tyr Met Met Asn 
505 

Phe Asp Gly Tyr 



Leu Gin lie Ala 
540 



Val Lys Ser Thr 
240 

Tyr Phe Leu Asp 
255 

lie Asp Gly Lys 
270 

Ala Asn Ala Pro 
285 

His Asn Ala Ala 



Gly Tyr Leu Thr 
320 

Asn Gly Thr Thr 
335 

Leu Met Ser Trp 
■ 350 

Tyr Met Gin Ser 
365 

Asp Asp Asn Met 



Asn He Glu Ser 
400 

Gin Asp Met Asn 
415 

Ser Glu Ser Lys 
4 30 

Val Asn Asp Asp 
4 4 5 

Asn Arg Thr Pro 



Gin Gly Gly Tyr 
480 

Pro Val Val Gin 
4 95 

He Gly Thr lie 
510 

Arg Val Asp Ala 
525 

Gly Asp Tyr Phe 
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Lys Ala Ala Tyr Gly Thr Gly Lys Thr Glu Ala Asn Ala Asn Asn His 

545 . ■ , 550 555 560 

lie Ser lie Leu Glu Asp Trp Asp Asn Asn Asp Ser Ala Tyr lie Lys 

565 . 570 575 • 

Ala His Gly Asn Asn Gin Leu Thr Met Asp Phe Pro Ala His Leu Ala 

580 585 . 590 

Leu Lys Tyr Ala. Leu Asn Met Pro Leu Ala Ala Gin Ser Gly Leu Glu 

595 600 - 605 

Pro Leu lie Asn Thr Ser Leu Val Lys Arg Gly Lys Asp Ala Thr Glu 

610 615 " 620 

Asn Glu Ala Gin Pro Asn Tyr Ala Phe lie Arg Ala His Asp Ser Glu 

625 630 635 640 

Val Gin Thr Val lie Ala Gin lie lie Lys Asp Lys lie Asn Thr Lys 

645 650 655 

Ser Asp Gly Leu Thr Val Thr Pro Asp Glu lie Lys Gin Ala Phe Thr 

660 . 665 • 670 . . , 



lie Tyr Asn Ala Asp Glu Leu Lys Ala Asp Lys Glu Tyr Thr Ala Tyr 
675 680 ' 685 



Asn lie Pro Ala Ser Tyr Ala Val Leu Leu Thr Asn Lys Asp Thr Val 

690 . 695 ; . 700. 

Pro Arg Val Tyr Tyr Gly Asp Leu Phe Ser Asp Asp Gly Gin Tyr Met 

705 710 • • . 715. . 720 . 

Ser Gin Lys Ser Pro Tyr Tyr Asp Ala lie Thr Ser Leu Leu Lys Ser 

725 ■ ■ 730 - - 735 

Arg lie Lys Tyr Val Ala Gly Gly Gin Ser Met Asn Met Thr Tyr Leu 

740 745 . 750 

His Glu Cys Phe Asp Pro Ala Lys Asn Glu Thr Lys Pro Gin Gly Val 

755 760 . 765 

Leu Thr Ser Val Arg Tyr Gly Lys Gly Ala Met Thr Ala Asp Asp Leu 

770 775 780 

Gly Asn Ser Asp Thr Arg Gin Gin Gly lie Gly Leu Val lie Asn Asn 

785 790 • • 795 800 

Lys Pro Phe Leu Asn Leu Asn Asp Asp Glu Gin lie Val Leu Asn Met 

805 810 • 815 

Gly Ala Ala His Lys Asn Gin Ala Tyr Arg Pro Leu Met Leu Thr Thr 

820 . * - 825 .830 

Lys Ser Gly Leu Gin He Tyr Asp Lys Asp Ala Gly Ala Pro Val Val 

835 840 • ■ ■ 845 



Tyr Thr Asn Asp Ala Gly Gin Leu He Phe Lys Ser Asp Met Val Tyr 
850 - 855 . :860 
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Gly Val Ser Asn Pro Gin Val Ser Gly Tyr Phe Ala Ala Trp Val Pro 
865 870 875 880 

Val Gly Ala Ser Asp Ser Gin Asp Ala Arg Thr Gin Ser Ser Gin Ser 
885 890 895 

Glu Thr Lys Asp Gly Asp Val Tyr His Ser Asn Ala Ala Leu Asp Ser 
90C 905 910 

Asn Val He Tyr Glu Gly Phe Ser Asn Phe Gin Ala Met Pro Glu Lys 
915 920 925 

Asn Asp Asp Phe Thr Asn Val Lys He Ala Gin Asn Ala Lys Leu Phe 
930 935 940 

Lys Asp Leu Gly He Thr Ser Phe Glu Leu Ala Pro Gin Tyr Arg Ser 
945 950 955 960 

Ser Thr Asp Asn Ser Phe Leu Asp Ser Val He Gin Asn Gly Tyr Ala 
965 970 975 

Phe Thr Asp Arg Tyr Asp Val Gly Tyr Asn Thr Pro Thr Lys Tyr Gly 
980 985 990 

Thr Val Asp Gin Leu Leu Asp Ser Leu Arg Ala Leu His Ala Gin Gly 
995 1000 1005 

He Gin Ala lie Asn Asp Trp Val Pro Asp Gin lie Tyr Asn Leu Pro 
1010 1015 1020 

Gly Glu Gin lie Val Thr Ala Val Arg Thr Asn Gly Ser Gly Lys Tyr 
1025 1030 1035 1040 

Asp Tyr Asp Ser Val He Asn Asn Thr Leu Tyr Asp Ser Arg Thr Val 
1045 1050 1055 

Gly Gly Gly Glu Tyr Gin Glu Lys Phe Gly Gly Leu Phe Leu Asp Gin 
1060 1065 1070 

Leu Lys Lys Asp Tyr Pro Ser Leu Phe Glu Thr Lys Gin lie Ser Thr 
1075 1080 1085 

Asn Gin Pro Met Asn Pro Asp Val Lys lie Lys Glu Trp Ser Ala Lys 
1090 1095 1100 

Tyr Phe Asn Gly Ser Asn lie Gin Gly Arg Gly Ala Trp Tyr Val Leu 
1105 1110 1115 1120 

Lys Asp Trp Ala Thr Asn Gin Tyr Phe Asn Val Ser Ser Asp Asn Gly 
1125 1130 1135 

Phe Leu Pro Lys Gin Leu Leu Gly Glu Lys Thr Ser Thr Gly Phe lie 
114 0 114 5 1150 

Thr Glu Asn Gly Lys Thr Ser Phe Tyr Ser Thr Ser Gly Tyr Gin Ala 
1155 1160 * 1165 

Lys Asp Thr Phe lie Gin Asp Gly Thr Asn Trp Tyr Tyr Phe Asp Asn 
1170 1175 1180 
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Ala Gly Tyr Met Leu Thr Gly Lys Gin Asn lie His Asp Lys Asn Tyr 

1185 ' 1190 1195 1200 

Tvr Phe Leu Pro Asn Gly Val Glu Leu Gin Asp Ala Tyr Leu Phe Asp 

1205 1210 . 1215 



Gly Asn Gin Glu Phe Tyr Tyr Asn Lys Ala Gly Glu Gin Val Met Asn 



1220 



1225 



1230 



Gin Tyr Tyr Gin Asp Ser Gin Asn Gin Trp His Tyr Phe Phe Glu Asn 
1235 1240 ' 1245 

Gly Arg Met Ala He Gly Leu Thr Glu Val Pro Asn Ala Asp Gly Thr 
1250 1255 1260 

His Val Thr Gin Tyr Phe Asp Ala Asn Gly Val Gin He Lys Gly Thr 
1265 1270 1275 . 1280 

Ala He Lys Asp Gin Asn Asn Gin Leu Arg Tyr Phe Asp Glu Ala Thr 
1285 1290 1295 

Gly Asn Met Val Val Asn Ser Trp Gly Gin Leu Ala Asp Lys Ser Trp 
1300 1305 . 1310 

Leu Tyr Leu Asn Ala Gin Gly Val Ala Val Thr Gly Asn Gin Lys He 
1315 1320 1325 

Asp Gly Glu Glu Tyr Tyr Phe Asn- Ala Asp Gly Lys Gin Val Lys # Gly < 
1330 1335 • ; 1340 

Asn Ala He lie Asp Asn Asn Gly Asp Gin-; Arg Tyr Tyr Asp Giy Asp 
1345 ■" 1350' -1355 • 1360 

Lys Giy Val Met Val Val Asn Ser -. Trp Gly Glu Leu Pro Asp Gly, Ser 
1365 ' 1370 1375 

Trp Leu Tyr Leu Asn Asp Lys Gly lie Ala Val Thr Gly Arg Gin. Val 
1380 ■ 1385 1390 

He Asn Asn Gin Val Asn Phe Phe Gly Asn Asp Gly Lys Gin lie: Lys 
13 95 14 00 14 05 

Asp Ala Phe Lys Leu Leu Ser Asp Gly Ser Trp Val Tyr Leu Asp Asp 
1410 1415 ( 1420 

Lys Gly Leu He Thr Thr Gly Ala Lys Val He Asn Gly Leu Asn Met 
1425 1430 1435 1440 

Phe Phe Asp Lys Asp- Gly- His Gin lie Lys Gly Asp Ala Ser Thr Asp 
1445 1450 . 1455 

Ala Asn Gly Lys Arg His Tyr Tyr Asp Lys Asn Asp Gly His Leu Val 
1460 1465 1470 

Thr Asn Ser Trp Gly Glu Leu -Pro Asp Gly Ser Trp Leu Tyr Leu Glu 
1475 1480 1485- 



Glu Gin Gly Asp Ala -Val Thr -Gly Gin Arg Val He -Asp Gly Lys Thr" < ; 
1490 * 1495 ~ 1500 
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Arg Tyr Phe Asp Glu Asp Gly Lys Gin lie Lys Asn Ser Leu Lys Thr 

1505 ' 1510 1515 1520 

Leu Ala Asn Gly Asp Lys lie Tyr Leu Asp Gly Asp Gly Val Ala Ala 

1525 1530 1535 

Thr Gly Leu Gin His Val Gly Asp Lys lie Met Tyr Phe Asp Glu Asp 

1540 1545 1550 



Gly Lys Gin Val Val Gly Lys Phe Val Ser Ala Lys Asp Gly Ser Trp 
1555 1560 1565 

Tyr Tyr Leu Asn Gin Asp Gly Val Ala Ala Val Gly Pro Ser Ser lie 
1570 1575 1580 

Asn Gly Gin Ser Leu Tyr Phe Asp Gin Asp Gly Lys Gin Val Lys Tyr 
1585 1590 1595 1600 

Asn Glu Val Arg Asn Ser Asp Gly Thr Thr Asn Tyr Tyr Thr Gly Leu 
1605 1610 1615 

Thr Gly Glu Lys Leu Thr Gin Asp Phe Gly Glu Leu Pro Asp Gly Ser 
1620 1625 ■ 1630 

Trp lie Tyr Leu Asp Ala Gin Gly His Thr Val Thr Gly Ala Gin He 
1635 1640 1645 

He Asn Gly Gin Asn Leu Tyr Phe Lys Ala Asp Gly Gin Gin Val Lys 
1650 1655 1660 

Gly His Ala Tyr Thr Asp Gin Leu Gly His Met Arg Phe Tyr Asp Pro 
1665 1670 1675 1680 



Asp Ser Gly Asp Met Leu Ser Asn Arg Phe Glu Gin lie Thr Pro Gly 



1685 



1690 



1695 



Val Trp Ala Tyr Phe Gly Ala Asp Gly Val Ala lie Thr Gly Gin His 

1700 1705 1710 

Asp He Asn Gly Gin Lys Leu Phe Phe Asp Glu Thr Gly Tyr Gin Val 

1715 1720 1725 

Lys Gly Ser Gin Arg Thr He Asp Gly Thr Leu Tyr Ser Phe Asp Ser 

1730 1735 1740 

Gin Thr Gly Asn Gin Lys Arg Val Gin Thr Thr Leu Leu Pro Gin Ala 

1745 1750 1755 1760 

Gly His Tyr He Thr Lys Asn Gly Asn Asp Trp Gin Tyr Asp Thr Asn 

1765 1770 1775 

Gly Glu Leu Ala Lys Gly Leu Arg Gin Asp Ser Asn Gly Lys Leu Arg 

1780 1785 1790 

Tyr Phe Asp Leu Thr Thr Gly He Gin Ala Lys Gly Gin Phe Val Thr 

1795 • 1800 " 1805 



lie Gly Gin Glu Thr Tyr Tyr Phe Ser Lys Asp His Gly Asp Ala Gin 
1810 1815 ^ 1820 
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Leu Leu Pro Met Val Thr Glu Gly His Tyr Gly Thr lie Thr Leu Lys 
1825 \ 1830 1835 1840 

Gin Gly Gin Asp Thr Lys Thr Ala Trp Val Tyr Arg Asp Gin Asn Asn 
1845 1850 ^ 1855 

Thr lie Leu Lys Gly Leu Gin Asn lie Asn Gly Thr Leu Gin Phe- Phe 
1860 1865 1870 

Asp Pro Tyr Thr. Gly Glu Gin Leu Lys Gly Gly Val Ala Lys Tyr Asp 
1875 1880 .1885 

Asp Lys Leu Phe Tyr Phe Glu Ser Gly Lys Gly Asn Leu Val Ser Thr 
1890 . . . 1895 , 1900^ 

Val Ala Gly Asp Tyr Gin Asp Gly His Tyr lie Ser Gin Asp Gly Gin 
1905 1910 1915 • 1920 

Thr Arg Tyr Ala Asp Lys Gin Asn Gin Leu Val Lys Gly Leu Val Thr 
1925 1930 1935 

Val Asn Gly Ala Leu Gin Tyr Phe Asp Asn Ala Thr Gly Asn Gin lie 
1940 1945 .1950 

Lys Asn Gin Gin Val He Val Asp Gly Lys Thr Tyr Tyr Phe Asp Asp 
1955 1960 1965 

Lys Gly Asn Gly Glu Tyr Leu Phe Thr Asn Thr Leu Asp Met Ser Thr 
1970 . ^ 1975- ..... . 1,980 . 

Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His Asp Ser Ser Ser 
1985 199.0. . , . ■. 1995., - f v , 2000 

Phe Asp His Thr Val Asp Gly Phe Leu Thr Ala Asp Thr Trp Tyr Arg 
2005 2010* . 2015 

Pro Lys Ser He Leu Ala Asn Gly Thr Thr Trp Arg Asp Ser Thr Asp 
2020 2025- 2030 - t 

Lys Asp Met Arg Pro Leu He Thr Val Trp Trp Pro Asn Lys Asn Val 
2035 2040 . 2045 

Gin Vai Asn Tyr Leu Asn Phe Met Lys Ala Asn Gly Leu Leu Thr Thr 
2050 .2055 m . 2060 

Ala Ala Gin Tyr Thr Leu His Ser Asp Gin Tyr Asp Leu Asn Gin Ala 
2065 2070 2075 . 2080 

Ala Gin Asp Val Gin Val Ala lie Glu Arg Arg lie Ala Ser Glu His 
2085 . 2090 2095 ■ : 

Gly Thr Asp Trp Leu Gin Lys Leu Leu Phe Glu Ser Gin Asn Asn Asn 
2100 2105 - • ?110 " 

Pro Ser Phe Val Lys Gin Gin Phe He Trp Asn Lys Asp Ser Glu Tyr 
2115 2120 • . 2125 

His Gly Gly Gly Asp Ala Trp Phe Gin Gly Gly Tyr Leu Lys Tyr Gly 
2130 2135 ".2140 • 
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Asn Asn Pro Leu Thr Pro Thr Thr Asn Ser Asp Tyr Arg Gin Pro Gly 
2145 2150 2155 " 2160 

Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
2165 2170 ' 2175 

Val Val Gin Ala Glu Asn Leu Asn Trp Leu His Tyr Leu Met Asn Phe 
• 218C 2185 2190 

Gly Thr lie Thr Ala Gly Gin Asp Asp Ala Asn Phe Asp Ser He Arg 
2195 2200 2205 

He Asp Ala Val Asp Phe He His Asn Asp Thr He Gin Arg Thr Tyr 
2210 2215 2220 

Asp Tyr Leu Arg Asp Ala Tyr Gin Val Gin Gin Ser Glu Ala Lys Ala 
2225 " 2230 2235 2240 

Asn Gin His He Ser Leu Val Glu Ala Gly Leu Asp Ala Gly Thr Ser 
2245 2250 2255 

Thr He His Asn Asp Ala Leu He Glu Ser Asn Leu Arg Glu Ala Ala 
2260 2265 2270 

Thr Leu Ser Leu Thr Asn Glu Pro Gly Lys Asn Lys Pro Leu Thr Asn 
2275 2280 2285 

Met Leu Gin Asp Val Asp Gly Gly Thr Leu He Thr Asp His Thr Gin 
2290 2295 2300 

Asn Ser Thr Glu Asn Gin Ala Thr Pro Asn Tyr Ser He He His Ala 
2305 2310 2315 2320 

His Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala He Thr Asp Ala 
2325 2330 2335 

Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin Leu Lys Ala Gly 
2340 2345 2350 

Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn Lys Lys Tyr Asn 
2355 2360 2365 

Ser Tyr Asn He Pro Ser lie Tyr Ala Leu Met Leu Thr Asn Lys Asp 
2370 2375 2380 

Thr Val Pro Arg Met Tyr Tyr Gly Asp Met Tyr Gin Asp Asp Gly Gin 
2385 2390 2395 * 2400 

Tyr Met Ala Asn Lys Ser lie Tyr Tyr Asp Ala Leu Val Ser Leu Met 
240 5 2410 2415 

Thr Ala Arg Lys Ser Tyr Val Ser Gly Gly Gin Thr Met Ser Val Asp 
2420 2425 2430 

Asn His Gly Leu Leu Lys Ser Val Arg Phe Gly Lys Asp Ala Met Thr 
2435 2440 2445 

Ala Asn Asp Leu Gly Thr Ser Ala Thr Arg Thr Glu Gly Leu Gly Val 
2450 2455 2460 
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lie lie Gly Asn Asp Pro Lys Leu Gin Leu Asn Asp Ser Asp Lys Val 

2465 ''2470 2475 2480 

Thr Leu Asp Met Gly Ala Ala His Lys Asn Gin Lys Tyr Arg Ala Val 

2485 . 2490 . 2495 

lie Leu Thr Thr Arg. Asp Gly Leu Ala Thr Phe Asn Ser Asp Gin Ala 

2500 2505 2510 



Pro Thr Ala Tro Thr- Asn Asp Gin Gly Thr Leu Thr Phe Ser Asn Gin 
2515 2520 2525 

Glu lie Asn Gly Gin Asp Asn Thr Gin lie Arg Gly Val Ala Asn Pro 
2530 2535 2540 

Gin Val Ser Gly Tyr Le.u- Ala Val Trp Val Pro Val Gly Ala Ser Asp 
2545 ; 2550 2555 - 2560 

Asn Gin Asp Ala Arg Thr Ala Ala Thr Thr- Thr Glu. Asn His Asp Gly 
2565 2570 2575 

Lys Val Leu His Ser Asn Ala;, Ala. Leu. Asp, Ser Asn Leu lie Tyr: Glu 
2580 • 2585 . . 2590 

Gly Phe Ser Asn Phe Gin ■ Pro Lys- Ala Thr" Thr His Asp Glu, Leu Thr 
2595 2600 2605 ■ 

Asn Val Val lie Ala.- Lys Asn ■ Ala . Asp Val Phe. Asn Asn. Trp- Gly*. lie. 
2610 2615 * . <. 2620 . 

Thr Ser Phe Glu Met Ala ; Pro, Gin:. Tyr. • Arg Ser Ser. Gly Asp.His ThrV 
2625 :;>2630 . ;.i-2635 . ,.'2640 

Phe Leu Asp Ser Thr. lie: Asp Asn~ Gly Tyr. ' Ala Phe ■ Thr Asp Ar§. Tyr " 
2645 • • 2650 . 2655 



Asp Leu Gly Phe Asn Thr Pro. Thr. Lys Tyr Gly Thr Asp Gly Asp" Leu' 
2660 2665 2670 



Arg Ala Thr lie Gin Ala Leu His His ,Ala Asn Met Gin Val Met ' Ala 
2675 2680 2685 



Asp Val Val Asp Asn Gin Val Tyr Asn Leu Pro Gly Lys Glu Val. Val' 
2690 2695 2700 

Ser Ala Thr Arg Ala Gly Val Tyr Gly Asn Asp Asp Ala Thr Gly- Phe 
2705 ■ ;2710 2715 2720 

Gly Thr Gin Leu Tyr Val Thr Asn .Ser Val -Gly Gly. Gly Gin Tyr'. Gin. 

2725 • 2730 2735 



Glu Lys Tyr Ala Gly Gin Tyr Leu Glu Ala Leu Lys Ala Lys Tyr ' Pro 
2740 . . 2745 2750 

Asp Leu Phe Glu Gly Lys Ala Tyr Asp Tyr ;Trp Tyr Lys Asn .Tyr Ala 
2755 2760 . 2765 / 

Asn Asp Gly Ser Asn. Pro Tyr Tyr Thr Leu Ser His Gly Asp Arg Glu 
2770 2775 • 2780 
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Ser lie Pro Ala Asp Val Ala lie Lys Gin Trp Ser Ala Lys Tyr Met 
2785 2790 2795 " 2800 

Asn Gly Thr Asn Val Leu Gly Asn Gly Met Gly Tyr Val Leu Lys Asp 
2805 2810 2815 

Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp Lys Ser Thr Leu 
2820 2825 ' 2830 

Pro Gin lie 
2835 



<210> 3 
<211> 2568 
<212> ADN 

<213> Nucleotides (domaine catalytique n° 2) 
<400> 3 

gatatgtcta ctaatgcttt ttctaccaaa aatgttgcat tcaatcatga cagtagcagt 60 
ttcgaccata ctgttgatgg cttcttgacg gcagatactt ggtatcgacc aaagtcaatt 120 
ttggctaacg ggacaacttg gcgtgattcg actgataagg atatgcgacc attaatcact 180 
gtttggtggc caaataagaa tgttcaagtc aactacctca acttcatgaa agcaaatggc 240 
ttgttgacaa cagcagcaca atacacacta cattcagatc aatatgattt gaaccaagct 300 
gcacaagatg ttcaagtggc cattgaaagg cgcattgcgt cagagcatgg cacagactgg 360 
ttacagaaat tgttgtttga atcacaaaat aataacccat catttgtgaa gcaacaattc 420 
atttggaaca aggattctga atatcatggt ggtggtgatg cttggttcca aggtggttat 480 
ctgaagtatg gcaataaccc actcacacca acaactaatt ctgattatcg tcaacctggt 540 
aatgcatttg atttcttgct agccaacgac gtggataatt ctaatcctgt tgtgcaagct 600 
gaaaacttaa actggttaca ttacttaatg aactttggca ccatcactgc gggtcaagat 660 
gacgctaatt ttgatagtat tcgtattgac gctgtcgact ttattcataa tgatacaatc 720 
caacgtactt atgattatct tcgtgatgct tatcaagtgc aacaaagtga agccaaagca 780 
aaccagcaca tttcattggt tgaagctggc ttagacgcag gtacatcaac gattcataat 840 
gatgcgtraa ttgagtcaaa cctccgtgaa gcagcgacat tgtcgttaac aaatgaacct 900 
ggtaaaaata aaccattgac gaatatgcta caagacgttg acggcggtac gcttatcacc 960 
gaccatacgc agaatagtac agaaaatcag gcgacaccaa actattcaat tattcacgcg 1020 
cacgataaag gtgtgcaaga aaaagtaggt gcagccatta ctgatgctac tggtgctgat 1080 
tggacgaact ttacagatga acagttaaaa gccggattag agctattcta taaggatcag 1140 
cgcgcaacaa acaaaaagta taatagttat aacataccaa gtatttatgc cctgatgttg 1200 
acaaacaaag atactgttcc tcgtatgtat tatggggata tgtatcaaga tgacggacag 1260 
tatatggcaa acaagagtat ctactatgat gccttagtgt cattaatgac ggctcgtaaa 1320 
agctatgtca gcggtggtca aactatgagt gttgacaatc atggtttgtt gaagagtgtc 1380 
cgttttggaa aagatgcgat gacagctaat gatttaggta catcagctac gcgtactgag 1440 
ggtcttggtg tcattattgg taatgatcca aagttgcaac ttaatgattc ggataaagtg 1500 
acactggata tgggtgcagc acataaaaat caaaagtatc gcgcagttat cttaacaaca 1560 
cgtgatggtt tggcaacctt taattcagat caagcaccaa cagcttggac aaacgatcaa 1620 
ggaacgttaa cattctcaaa tcaagagatt aacgggcaag acaatacaca aattcgtggt 1680 
gttgctaatc cgcaagtttc tggttatcta gctgtttggg tgcctgtggg tgcatcagac 1740 
aatcaagatg cccgtacagc agcaacgaca acagaaaatc atgatggtaa agtattacac 1800 
tcgaatgcgg cattagattc taaccttatt tatgaaggtt tctctaactt ccaacctaag 1860 
gcaacaacgc atgatgaact tacgaacgtt gtaattgcta aaaatgccga tgtcttcaat 1920 
aattggggta ttacgagttt tgaaatgqca ccacagtacc gttcaagtgg ggaccataca 1980 
ttcttggatt caacgattga taatggttat gccttcactg atcgctatga cttaggtttc 2040 
aatacaccaa caaagtatgg cactgatggt gatttgcgtg caacgattca agcgctacat 2100 
catgctaata tgcaagttat ggctgacgtt gttgataacc aggtctataa cttacctggt 2160 
aaagaagttg tttcagcaac acgagcaggt gtttatggta atgacgacgc cacgggcttt 2220 
ggaacgcaac tctatgtgac taactccgtt ggtggtggtc aataccaaga gaaatatgct 2280 
ggacaatact tagaagctct gaaagcaaag tatccagacc tctttgaggg taaggcctat 2340 
gattattggt ataagaacta tgcaaatgat gggtcaaatc cttactatac attgtcacac 2400 
ggtgaccgtg aatctatccc agcagatgtt gctattaagc aatggtcagc taagtatatg 2460 
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aacggcacga acgttttggg caatggtatg ggttatgtat t gaaggattg . gcataatggt 2520 
caatatttca agctrgatgg tgataaatca acattacctc aaatttaa 2568 



<210> 4 
<211> 8506 
<212> ADN 

<213> Sequence codant DSR-E 
<400> 4 

atgagagaca tgagggtaat ttgtgaccgt aaaaaattgt acaaatcggg caaagtacta 60 
gtaacagccg gtatttttgc tttgatgatg tttggcgtca caactgctag tgttagtgca 120 
aatacgattg cagttgacac gaatcatagc cgtacttcag cacagattaa taagagtgcc 180 
gttgataagg ttaatgatga caagactact ttaggagcgg caaaagtagt ggcagtagcc 240 
acaacgccag cgacaccggt agcagataaa acagtaagtg cacccgcagc agataaggca 300 
gtagatacaa cgtcatcaac gacacctgca acggataagg cagtagatac aacgccaacg 360 
acacctgcag cagataaggc agtagataca acgccaacga cacctgcagc agataaggca 420 
gtagatacaa cgccaacgac acctgcagca aataaagcag tagatacaac gccagcgacc 480 
gctgcaacag ataaggcggt agccacgcca gccacacctg cagcagataa gctagcaaat 540 
acgacgcctg caacggacaa ggcagtagcc acaacgccag cgacgccggt agcaaataaa 600 
gcagcagaca cgagtagtat tcatgatcaa ccattagata caaatgtgcc aactgataaa 660 
tcagcaaacc tcgtctcgac aacacaaaaa agtacggata atcaacaagt taagtctaca 720 
gaaacatctc atcttcaaga aatcaacggt aaaacctatt ttcttgacga caatggtcaa 780 
gttaaaaaga acttcaccgc tattattgac ggtaaagttc tatactttga taaaacatcc 840 - 
ggcgaattga ccgcaaatgc accgcaagtt actaagggat tagt aaatat^.tgataa tgca. 900 :; 
cataacgcgg ctcatgatct cacagctgat aacttcacaa atgtcgatgg ttacttaaca 960 
gctaacagtt ggtatc.gtcc t.aaggacatc ttaaaaaacg gaacgacctg gacaccaaca 1020 
acagcagaag attttcgacc attg.ctcatg tcttggtggc cggataagaa tacgcaggt-a 1080 
gcttatctac !aatatatgca atcagttggt atgctacctg acgatgttaa. agtatcaaat 1140 
gatgataata t'gagcac'att " gactgatgct gctatgactg ttcaaaagaa tatcgaatcg 1200 
cgaattggtg tatctggaaa' aactgattgg ctcaagcaag atatgaacaa f actgattgat 1260 
tcacaggcaa attggaatat tgatagtgaa tcaaagggta. atgatcattt ' acagggtggg 1320- 
gcattgttat atgtgaatga tgacaaaaca. cctaacgcga actcagatta ccgtctgtta 1380 
aaccgtacac caaccaacca aaccggccaa." attactgatc caagtaaaca aggtggatat .1440 
gagatgttat tagctaatga tgttgataat tctaaccctg ttgtacaagc . tgagcaattg 1500 
aactggcttc actacatgat gaacattggt actatagctc agaacgaccc aacagctaat 1560- 
tttgacggtt atcgtgttga tgcggttgat aacgttgatg ccgatctctt acaaattgct 1620- 
ggtgattact ttaaagctgc atacggtact ggtaaaactg aggcaaacgc aaacaatcat 1680 
atttcgatct tggaagattg ggataataat gattctgcgt acattaaagc ccacgggaat 1740 
aaccaattga caatggattt tccagcacac ttggctttga aatacgcctt gaacatgcct 1800 
cttgccgcac aaagtggcct agaaccgcta attaatacaa gtcttgttaa gcgtgggaaa 1860 
gatgccacag aaaatgaagc .acaacca.aac tatgccttta tccgtgccca .tgatagtgaa 1920 
gtgcagaccg ttattgcaca aattattaag gataaaatta acacaaaat c . agacggct ta 1980 
actgtaacac cagatgagat taagcaagct ttcactattt acaacgccga tgaattaaaa 2040 
gcagataagg aatatacagc atacaatatt cctgcttctt acgctgtatt gttgacaaac 2100 
aaggatactg tgccacgtgt ttattatggt gatctatttt ctgatgatgg acagtatatg 2160 
tcacagaagt caccatacta tgacgccatt acgtcacttt tgaaaagccg tatcaaatat 2220 
gttgctggtg gtcaaagtat gaatatgacg. tacttgcatg agtgctttga tccagcaaaa 2280 
aatgagacaa agccacaagg tgtcttaaca tcagtacgtt acggtaaagg tgcgatg.acg 2340 
gctgacgatt tgggtaatag tgacacacgt caacaaggta ttggtttggt gattaataat 2400 
aagccattct tgaatttaaa tgatgatgaa caaattgtgc tcaatatggg tgctgctcac 2460 
aaaaatcaag ct.taccgacc .acttatgttg acaacaaaat ctggtcttca aatttacgat 2520 
aaggatgccg gagcgccagt" .tgtttatact ,'aacgatgctg gtcaacttat ttt-taagtca 2580 
gatatggtct atggtgtcag .caatccacag gtatctggtt attttgctgc atgggtacca 2640 
gtcggtgcga gtgatagtca agatgctaga acacaaagca gccagtcaga -aactaaggat 2700 
ggcgatgtct atcattcaaa tgctgcgctt gattctaatg tgatttatga aggcttctcg 2760 
aatttccaag caatgpctga aaagaatgat gacttcacca acgtaaaaat tgctcaaaat *2820 
gctaaattgt ttaaagattt agggattaca agctttgaat -tagcaccgca atatcgttca 2880 
agtacagata atagtttttt ggattcggtt atccaaaacg gctatgcctt tactgatcga 2940 
tatgatgttg gctataat.ac gccaacaaaa tatggtacag ttgatcaact tctagatagt .3000 



14. 
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ctaagagcat 
tataatttac 
gattatqatt 
taccaagaaa 
tt t gaaact a 
tggt ct gcaa 
aaagactggg 
cagttact gg 
tact caacaa 
tactttgata 
tatttcttac 
ttttactata 
caatggcat t 
gctgatggca 
gctataaaag 
gttaat teat 
gctgtgactg 
caagttaaag 
aagggtgtca 
aatgacaaag 
ggtaatgatg 
tatttggatg 
t ttt ttgata 
cgecatt att 
gatggtt cat 
gatggcaaga 
ct ggccaa tg 
cat gtgggcg 
gtatcagcaa 
ccaagcagca 
aatgaagt tc 
tt aacgeaag 
cat acagt aa 
cagcaagtta 
gat tcaggt g 
t tt ggtgctg 
t ttgatgaga 
agcttcgatt 
ggtcactata 
aagggt ctgc 
caagegaaag 
ggggatgege 
caaggtcaag 
ggat tgcaaa 
aagggtggcg 
ct t gt tagca 
acacgttacg 
t tacaatact 
ggcaagacgt 
gatatgt eta 
tt cgaccata 
t tggctaacg 
gtttggtggc 
ttgttgacaa 
gcacaaga tg 
ttacagaaat 
atttggaaca 
ctgaagtatg 
aat gcatt tg 
gaaaactt aa 
gaegctaa tt 



tacacgcaca 
ctggcgaaca 
cagtgat t aa 
agtttggtgg 
agcagatatc 
agtactttaa 
caacaaatca 
gtgaaaaaac 
gtggttat ca 
atgeaggcta 
ctaatggtgt 
ataaagct gg 
att tct ttga 
cccatgttac 
atcagaataa 
ggggacagtt 
gtaaccaaaa 
geaatgeaat 
tggtagt taa 
gtattgctgt 
gtaagcaaat 
ataagggect 
aagaeggtea 
a tgacaaaaa 
ggttatatct 
caegctattt 
gcgataagat 
ataaaatcat 
aagatggttc 
ttaatggaca 
gtaatagtga 
acttcggtga 
ctggtgcaca 
aaggtcatgc 
atatgttgag 
atggtgtggc 
caggatatca 
ctcaaactgg 
tcacgaaaaa 
gtcaagatag 
gecaat ttgt 
agttattgcc 
acaccaaaac 
atat caatgg 
tagcaaagta 
cegtagcagg 
cagat aagca 
ttgataaege 
actattttga 
etaatgettt 
ctgt tgatgg 
ggacaacttg 
caaataagaa 
cagcagcaca 
ttcaagtggc 
tgt tgtttga 
aggatt ctga 
gcaataaccc 
att tct tget 
actggttaca 
ttgatagtat 



aggtattcag 
aatcgtcacc 
taacacgctc 
cctgtt ctta 
aacgaatcag 
tggttcaaac 
atatttcaat 
aagcaccggc 
agctaaagat 
tatgttgaca 
ggaactt caa 
ggaacaagtt 
aaatggt cgc 
acaatat ttt 
t caattaege 
agcagataag 
aattgatggt 
catcgataat 
ttcatggggt 
aacaggcegt 
caaagatgee 
gataacaact 
t caaatcaaa 
tgatggtcat 
agaagaacaa 
tgatgaagat 
ttatcttgat 
gtattttgat 
atggtat tac 
atcact ttac 
tggaacaacc 
actaccagat 
aatcattaac 
t tatactgac 
taatcgcttt 
cataactgga 
agttaaaggt 
taaccaaaaa 
tggtaacgat 
caatggtaag 
t acaattggc 
aatggtcact 
agcctgggtt 
cacgttgcaa 
tgacgacaag 
tgact atcag 
aaatcagctt 
tactggtaac 
cgataaaggc 
ttctaccaaa 
ct t ctt gacg 
gcg tgat teg 
tgttcaagtc 
at acacacta 
cat tgaaagg 
atcacaaaat 
at atcat ggt 
act cacacca 
agccaacgac 
ttacttaatg 
tegtattgae 



gctattaatg 
gcagttcgta 
tatgattcac 
gaccagttga 
ccgatgaatc 
attcaaggtc 
gtgtctagtg 
tttataacag 
acctttattc 
ggtaaacaaa 
gatgettace 
atgaaccagt 
atggcaattg 
gatgetaatg 
tattttgatg 
tct tggcttt 
gaagagtact 
aatggtgatc 
gagttgccag 
caagtcatta 
tttaaattat 
ggagccaaag 
ggtgatgcca 
cttgtcacaa 
ggtgatgctg 
ggcaaacaaa 
ggtgatgggg 
gaagatggca 
ttaaatcagg 
tttgatcaag 
aactattaca 
ggttcatgga 
ggt caaaatc 
caattaggtc 
gaacaaatca 
caacatgaca 
tegcaaegta 
cgegtacaga 
tggcagtatg 
ttgcgttact 
caagaaactt 
gaagggcatt 
tacegtgat c 
ttctttgatc 
ctcttttact 
gatggt catt 
gtaaagggac 
caaataaaaa 
aatggtgaat 
aatgttgcat 
gcagatactt 
actgataagg 
aactacctca 
cattcagatc 
cgcattgcgt 
aataacccat 
ggtggtgatg 
acaactaatt 
gtggataatt 
aactttggca 
gctgtcgact 



actgggtacc 

caaatggt tc 

gaacagttgg 

aaaaagatta 

cggatgttaa 

gtggcgcttg 

ataatggat t 

aaaatggtaa 

aagatggaac 

atatccacga 

tttttgatgg 

attatcaaga 

gectgacaga 

gtgtccaaat 

aggecacagg 

accttaatgc 

acttcaatgc 

aacgttatta 

atggctcatg 

ataatcaagt 

tatccgatgg 

ttatcaatgg 

geaeggatge 

attcatgggg 

ttactggtca 

ttaaaaatag 

ttgetgeaac 

aacaagttgt 

atggtgttgc 

atggtaaaca 

caggattaac 

tttatcttga 

tttactttaa 

atatgcgttt 

cacctggtgt 

t aaatggtca 

caatagatgg 

caacattgtt 

ataccaatgg 

ttgat ttgac 

attactttag 

aeggtacaat 

aaaataatac 

catat acagg 

ttgaat cagg 

atatttccca 

ttgttactgt 

atcaacaagt 

acttattcac 

tcaatcatga 

ggt atcgacc 

atat gegace 

acttcatgaa 

aatatgattt 

cagagcatgg 

catttgtgaa 

cttggttcca 

ctgattatcg 

ctaatcctgt 

ccatcactgc 

ttattcataa 



tgat caaatt 

aggtaagtac 

gggcggcgaa 

tcctagcttg 

aattaaagaa 

gtatgtactt 

ettgect aaa 

gacttctttc 

aaattggtat 

taaaaattat 

taatcaagaa 

tagtcaaaat 

agttccgaac 

taaaggcaca 

taatatggtg 

acaaggegtt 

tgatggtaag 

tgatggtgat 

gttatatttg 

taatttcttt 

ttcatgggtg 

tctaaatatg 

caatggtaag 

tgagttgcca 

acgtgtgatt 

cctaaaaacg 

aggcttacaa 

tggcaagt tt 

cgcggttggt 

agttaaatat 

gggtgaaaag 

tgcgcaaggt 

ggctgaegge 

ttatgatcct 

atgggcttac 

gaagctattc 

tacgttatac 

gccacaagca 

tgaactagcg 

aaceggcata 

taaagat cac 

aacactcaag 

tatt ttgaag 

t gaacaactt 

taaaggtaat 

agatggccaa 

taatggggca 

tattgttgat 

taatacatta 

cagtagcagt 

aaagtcaatt 

at t aat cact 

agcaaatggc 

gaaccaagct 

cacagactgg 

gcaacaattc 

aggtggttat 

tcaacctggt 

tgtgcaagct 

gggtcaagat 

tgatacaatc 



3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 
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caacgtactt atgattatct tcgtgatgct tatcaagtgc aacaaagtga agccaaagca 6720 
aaccagcaca tttcattggt tgaagctggc ttagacgcag gtacatcaac gattcataat 6780 
gatgcgttaa ttgagtcaaa cctccgtgaa gcagcgacat tgtcgttaac aaatgaacct 6840 
ggtaaaaata aaccattgac gaatatgcta caagacgttg acggcggtac gcttatcacc 6900 
gaccatacgc agaatagtac agaaaatcag gcgacaccaa actattcaat tattcacgcg 6960 
cacgataaag gtgtgcaaga aaaagtaggt gcagccatta ctgatgctac tggtgctgat 7020 
tggacgaact ttacagatga acagttaaaa gccggattag agctattcta taaggatcag 7080 
cgcgcaacaa acaaaaagta taatagttat aacataccaa gtatttatgc cctgatgttg 7140 
acaaacaaag atactgttcc tcgtatgtat tatggggata tgtatcaaga tgacggacag 7200 
tatatggcaa acaa.gagtat ctactatgat gccttagtgt cattaatgac ggctcgtaaa 7260 
agctatgtca gcggtggtca aactatgagt gttgacaatc atggtttgtt gaagagtgtc 7320 
cgttttggaa aagatgcgat gacagctaat gatttaggta catcagctac gcgtacfgag 7380 
ggtcttggtg tcattattgg taatgatcca aagttgcaac ttaatgattc ggataaagtg 7440 
acactggata tgggtgcagc acataaaaat caaaagtatc gcgcagttat cttaacaaca 7500 
cgtgatggtf tggcaacctt taattcagat caagcaccaa cagcttggac aaacgatcaa 7560 
ggaacgttaa cattctcaaa tcaagagatt aacgggcaag acaatacaca aattcgtggt 7620 
gttgctaatc cgcaagtttc tggttatcta gctgtttggg tgcctgtggg tgcatcagac 7680 
aatcaagatg cccgtacagc agcaacgaca acagaaaatc atgatggtaa agtattacac 7740 
tcgaatgcgg cattagattc taaccttatt tatgaaggtt tctctaactt ccaacctaag 7800 
gcaacaacgc atgatgaact tacgaacgtt gtaattgcta aaaatgccga tgtcttcaat 7860 
aattggggta ttacgagttt tgaaatggca ccacagtacc gttcaagtgg ggaccataca 7920 
ttcttggatt caacgattga taatgg.ttat gccttcactg atcgctatga cttaggtttc 7980 
aatacaccaa caaagtatgg cactgatggt gatttgcgtg caacgattca agcgctacat 8040 
catgctaata tgcaagttat ggctgacgtt gttgataacc aggtctataa cttacctggt 8100 
aaagaagttg tttcagcaac acgagcaggt gtttatggta atgacgacgc cacgggcttt 8160% 
ggaacgcaac tctatgtgac taactccgtt ggtggtggtc aataccaaga . gaaatatgct 8220- 
ggacaatact tagaagctct gaaagcaaag tatccagacc tctttgaggg taaggcctat 8280 
gattattggt ataagaacta tgcaaatgat gggtcaaatc cttactatac . at tgtcacac 8340' 
ggtgaccgtg aatctatccc agcagatgtt gctattaagc aatggtcagc taagtatatg 8400 
aacggcacga. acgttttggg caatggtatg ggttatgtat tgaaggattg gcataatggt 8460 
caatatttca agcttgatgg tgataaatca acattacctc aaattt 8506 



<210> 5 

<211> 8931 . 

<212> ADN 

<213> Gene dsr-E 

<400> 5 

aataatctgt ctccattgct ttcaaaataa taatagttaa ttattatcat ggaacaatca 60 
atattttatt tatattcact attgaatatc cttttttgca taaatctcta gagccgattt 120 
tttgggttat acaatgaatt ggtaaaggtt aatcattttt acaaaaccat ggtggttttt 180 
tattttttct aaaattaccg aactagagga agagaaaagg agcaatagtt gtatgagaga 240 
catgagggta atttgtgacc gtaaaaaatt gtacaaatcg ggcaaagtac tagtaacagc 300 
cggtattttt gctttgatga tgtttggcgt cacaactgct agtgttagtg caaatacgat 360 
tgcagttgac acgaatcata gccgtacttc agcacagatt aataagagtg ccgttgataa 420 
ggttaatgat gacaagacta ctttaggagc ggcaaaagta gtggcagtag ccacaacgcc 480 
agcgacaccg gtagcagata aaacagtaag tgcacccgca gcagataagg cagtagatac *540- 
aacgtcatca acgacacctg caacggataa ggcagtagat acaacgccaa cgacacctgc 600 
agcagataag gcagtagata caacgccaac gacacctgca gcagataagg cagtagatac 660 
aacgccaacg acacctgcag . caaataaagc agtagataca acgccagcga ccgctgcaac 720 
agataaggcg gtagccacgc cagccacacc tgcagcagat aagctagcaa atacgacgcc 780 
tgcaacggac aaggcagtag ccacaacgcc agcgacgccg gtagcaaata aagcagcaga 840 
cacgagtagt attcatgatc aaccattaga tacaaatgtg ccaactgata aatcagcaaa 900 
cctcgtctcg acaacacaaa aaagtacgga taatcaacaa gttaagtcta cagaaacatc 960 
tcatcttcaa gaaatcaacg gtaaaaccta ttttcttgac gacaatggtc aagttaaaaa 1020 
gaacttcacc gctattattg acggtaaagt tctatacttt gataaaacat ccggcgaatt 1080 
gaccgcaaat gcaccgcaag ttactaaggg attagtaaat attgataatg cacataacgc 1140 
ggctcatgat ctcacagctg ataacttcac aaatgtcgat ggttacttaa cagctaacag 1200 
ttggtatcgt cctaaggaca tcttaaaaaa cggaacgacc tggacaccaa caacagcaga 1260 
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agattttcga 
acaataiatg 
tatgagcaca 
tgtatctgga 
aaattggaat 
atatgtgaat 
accaaccaac 
attagctaat 
tcactacatg 
ttatcgtgtt 
ctttaaagct 
ct tggaagat 
gacaatggat 
acaaagtggc 
agaaaatgaa 
cgttattgca 
accagatgag 
ggaatataca 
tgtgccacgt 
gtcaccatac 
tggt caaagt 
aaagccacaa 
tt tgggtaat 
cttgaattta 
agcttaccga 
cggagcgcca 
c tatggtgtc 
gagtgatagt 
ct atcatt ca 
agcaatgcct 
gtt taaagat 
taatagtt tt 
tggct ataat 
attacacgca 
acctggcgaa 
ttcagtgatt 
aaagtttggt 
taagcagata 
aaagt acttt 
ggcaacaaat 
gggtgaaaaa 
aagtggt tat 
taatgcaggc 
acctaatggt 
taataaagct 
ttatttcttt 
cacccatgtt 
agat cagaat 
atggggacag 
tggtaaccaa 
aggcaatgca 
catggtagtt 
aggtattgct 
tggtaagcaa 
tgataagggc 
taaagacggt 
t ta tgacaaa 
atggt tat at 
gacacgct at 

tggcgataag 

cgataaaatc 



ccat tgctca 
caatcagttg 
ttgactgatg 
aaaactgatt 
at tgatagtg 
gatgacaaaa 
caaaccggcc 
gatgttgat a 
atgaacattg 
gatgcggttg 
gcatacggta 
t gggataata 
t t tccagcac 
ctagaaccgc 
gcacaaccaa 
caaattatta 
a tt aagcaag 
gcatacaata 
gtttattatg 
tat gacgcca 
atgaatatga 
ggtgtcttaa 
agtgacacac 
aatgatgatg 
ccact tat gt 
gttgt ttata 
agcaat ccac 
caaga tgcta 
aatgctgcgc 
gaaaagaatg 
t tagggatta 
t tggatt egg 
acgccaacaa 
caaggtat tc 
caaategtea 
aataacaege 
ggect gtt ct 
tcaacgaatc 
aatggttcaa 
caatattt ca 
acaagcaccg 
caagctaaag 
tatat gtt ga 
gtggaact tc 
ggggaacaag 
gaaaatggtc 
acacaatatt 
aatcaattac 
ttagcagata 
aaaattgatg 
atcatcgata 
aattcatggg 
gtaacaggee 
a tcaaagatg 
ctgataacaa 
catcaaat ca 
aatgatggtc 
ctagaagaac 
tttgatgaag 
atttatcttg 
atgtattttg 



tgtcttggtg 
gtatgetace 
ctgetatgae 
ggctcaagca 
aatcaaaggg 
cacctaacgc 
aaat tactga 
at tctaaccc 
gt actatagc 
ataacgttga 
ct ggtaaaac 
atgat tetge 
acttggcttt 
taattaatac 
actatgect t 
aggataaaat 
ctt tcactat 
ttcctgcttc 
gtgatctatt 
ttaegtcact 
egtacttgea 
catcagtacg 
gtcaacaagg 
aacaaattgt 
tgacaacaaa 
etaacgatge 
aggtatctgg 
gaacacaaag 
ttgattctaa 
atgacttcac 
caagctttga 
tt atccaaaa 
aat atggtac 
aggctatt aa 
ccgcagt teg 
tctatgattc 
tagaccagtt 
agecgatgaa 
acattcaagg 
atgtgtctag 
gctttataac 
atacctt tat 
caggtaaaca 
aagatgetta 
ttatgaacca 
gcatggcaat 
ttgatgctaa 
gctattttga 
agt cttggct 
gtgaagagta 
ataatggtga 
gtgagttgcc 
gtcaagtcat 
cct ttaaatt 
ctggagccaa 
aaggtgatgc 
atcttgtcac 
aaggtgatgc 
atggcaaaca 
atggtgatgg 
atgaagatgg 



geeggataag 
tgacgatgtt 
tgttcaaaag 
agatatgaac 
taatgatcat 
gaact cagat 
t ccaagtaaa 
tgttgtacaa 
tcagaacgac 
tgccgatctc 
tgaggcaaac 
gtacattaaa 
gaaatacgee 
aagtcttgtt 
tatccgtgcc 
taacacaaaa 
ttacaacgcc 
ttacgctgta 
ttctgatgat 
tt tgaaaagc 
tgagtgcttt 
ttacggtaaa 
tattggtttg 
gctcaatatg 
atctggtctt 
tggtcaactt 
ttattttget 
cagccagtca 
tgtgatttat 
caaegtaaaa 
attagcaccg 
cggctatgcc 
agt tgatcaa 
tgactgggta 
tacaaatggt 
acgaacagtt 
gaaaaaagat 
tccggatgtt 
tcgtggcgct 
tgataatgga 
agaaaatggt 
tcaagatgga 
aaatatccac 
cct t tttgat 
gt at tat caa 
tggectgaca 
tggtgtccaa 
tgaggecaca 
tt acct taat 
ct actt caat 
teaaegt tat 
agatggctca 
taataatcaa 
attatccgat 
agttatcaat 
cagcaeggat 
aaattcatgg 
tgttactggt 
aattaaaaat 
ggttgctgca 
caaacaagtt 



aataegcagg 
aaagtatcaa 
aatatcgaat 
aaactgattg 
t tacagggtg 
t acegtctgt 
caaggtggat 
gctgagcaat 
ccaacagcta 
ttacaaattg 
gcaaacaatc 
gcccacggga 
ttgaacatgc 
aagcgtggga 
catgatagtg 
teagaegget 
gatgaattaa 
ttgttgacaa 
ggacagtata 
cgtatcaaat 
gatccagcaa 
ggtgcgatga 
gtgattaata 
ggtgctgctc 
caaatttacg 
atttttaagt 
gcatgggtac 
gaaactaagg 
gaaggcttct 
attgetcaaa 
caatategtt 
tttactgatc 
cttctagata 
cct gatcaaa 
tcaggtaagt 
gggggcggcg 
tat cctagct 
aaaattaaag 
tggtatgtac 
ttcttgecta 
aagactt ctt 
acaaattggt 
gataaaaatt 
ggtaatcaag 
gatagtcaaa 
gaagttccga 
attaaaggca 
ggtaatatgg 
geacaaggeg 
gctgatggta 
tatgatggtg 
tggttatatt 
gttaatttct 
ggttcatggg 
ggtctaaata 
gccaatggta 
ggtgagttgc 
caacgtgtga 
agectaaaaa 
acaggcttac 
gttggcaagt 



tagcttatct 
atgatgataa 
cgcgaattgg 
attcacaggc 
gggcattgtt 
taaacegtae 
atgagatgt t 
tgaactggct 
attttgaegg 
ctggtgatta 
atattt cga t 
ataaccaatt 
ctcttgccgc 
aagatgecac 
aagt gcagac 
taactgtaac 
aagcagataa 
acaaggatac 
tgtcacagaa 
atgttgctgg 
aaaatgagac 
eggctgaega 
ataagecatt 
acaaaaatca 
ataaggatgc 
cagatatggt 
cagteggt gc 
a t ggegat gt 
cgaatttcca 
atgetaaatt 
caagtacaga 
gatatgat gt 
gtctaagagc 
tttataattt 
acgattatga 
aataccaaga 
tgtttgaaac 
aatggtctgc 
ttaaagactg 
aacagt tact 
tctactcaac 
attacttt ga 
attatttctt 
aa ttt tacta 
atcaatggca 
aegctgat gg 
cagctataaa 
tggttaattc 
ttgctgtgac 
agcaagtt aa 
ataagggtgt 
tgaatgacaa 
ttggtaatga 
tgtatttgga 
tgttttttga 
agegecat ta 
cagatggtt c 
ttgatggcaa 
cgctggccaa 
aacatgtggg 
ttgtatcagc 



1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
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aaaagatggt tcatggtatt acttaaatca 
cattaatgga caatcacttt actttgatca 
tcgtaatagt gatggaacaa ccaactatta 
agacttcggt gaactaccag atggttcatg 
aactggtgca caaatcatta acggtcaaaa 
taaaggtcat gcttatactg accaattagg 
tgatatgttg agtaatcgct ttgaacaaat 
tgatggtgtg gccataactg gacaacatga 
gacaggatat caagttaaag gttcgcaacg 
ttctcaaact ggtaaccaaa aacgcgtaca 
tatcacgaaa aatggtaacg attggcagta 
gcgtcaagat agcaatggta agttgcgtta 
aggccaattt gttacaattg gccaagaaac 
gcagttattg ccaatggtca ctgaagggca 
agacaccaaa acagcctggg tttaccgtga 
aaatatcaat 'ggcacgttgc aattctttga 
cgtagcaaag tatgacgaca agctctttta 
caccgtagca ggtgactatc aggatggtca 
cgcagataag caaaatcagc ttgtaaaggg 
ctttgataac gctactggta accaaataaa 
gtactatttt gacgataaag gcaatggtga 
tactaatgct ttttctacca aaaatgttgc 
tactgttgat ggcttctt ga cggcagatac 
cgggacaact tggcgtgatt cgactgataa 
. gccaaataag aatgttcaag tcaactacct 
aacagcagca caatacacac tacattcaga 
tgttcaagtg gccattgaaa ggcgcattgc 
attgttgttt gaatcacaaa. ataataaccc 
caaggattct gaatatcatg gtggtggt.ga 
tggcaataac -ccactcacac. caacaactaa 
tgatttcttg ctagccaacg acgtggataa 
aaactggtta cattacttaa tgaactttgg 
ttttgatagt attcgtattg acgctgtcga 
ttatgattat cttcgtgatg cttatcaagt 
catt t cattg . gttgaagctg gcttagacgc 
aattgagtca .aacctccgtg aagcagcgac 
taaaccattg acgaatatgc tacaagacgt 
gcagaatagt acagaaaatc aggcgacacc 
aggtgtgcaa gaaaaagtag gtgcagccat 
ctttacagat gaacagttaa aagccggatt 
aaacaaaaag tataatagtt ataacatacc 
agatactgtt cctcgtatgt attatgggga 
aaacaagagt atctactatg atgccttagt 
cagcggtggt caaactatga gtgttgacaa 
aaaagatgcg atgacagcta atgatttagg 
tgtcattatt ggtaatgatc caaagttgca 
tatgggtgca gcacataaaa atcaaaagta 
tttggcaacc tttaattcag .atcaagcacc 
aacattctca aatcaagaga ttaacgggca 
tccgcaagtt tctggttatc tagctgtttg 
tgcccgtaca 'gcagcaacga caacagaaaa 
ggcattagat tctaacctta tttatgaagg 
gcatgatgaa cttacgaacg ttgtaattgc 
tattacgagt tttgaaatgg caccacagta 
ttcaacgatt gataatggtt atgccttcac 
aacaaagtat ggcactgatg gtgatttgcg 
tatgcaagtt atggctgacg ttgttgataa 
tgtttcagca acacgagcag gtgtttatgg 
actctatgtg actaactccg ttggtggtgg 
cttagaagct ctgaaagcaa agtatccaga 
gtataagaac tatgcaaatg atgggtcaaa 



ggatggtgtt gccgcggttg gtccaagcag 4 980 
agatggtaaa caagttaaat ataatgaagt 5040 
cacaggatta acgggtgaaa agttaacgca 5100 
gatttatctt gatgcgcaag gtcatacagt 5160 
tctttacttt aaggctgacg gccagcaagt 5220 
tcatatgcgt ttttatgatc ctgattcagg 5280 
cacacctggt gtatgggctt actttggtgc 5340 
cataaatggt cagaagctat tctttgatga 5400 
tacaatagat ggtacgttat acagcttcga 54 60 
gacaacattg ttgccacaag caggtcacta 5520 
tgataccaat ggtgaactag cgaagggtct . 5580 
ctttgatttg acaaccggca tacaagcgaa 564 0 
ttattacttt agtaaagatc acggggatgc 5700 
ttacggtaca ataacactca agcaagg'tca 5760 
tcaaaataat actattttga agggattgca 5820 
tccatataca ggtgaacaac ttaagggtgg 5880 
ctttgaatca ggtaaaggta atcttgttag 5940 
ttatatttcc caagatggcc aaacacgtta 6000 
acttgttact gttaatgggg cattacaata 6060 
aaatcaacaa gttattgttg atggcaagac 6120 
atacttattc actaatacat tagatatgtc 6180 
attcaatcat gacagtagca gtttcgacca 6240 
ttggtatcga ccaaagtcaa ttttggctaa 6300 
ggatatgcga ccattaatca ctgtttggtg 6360 
caacttcatg aaagcaaatg gcttgttgac 6420 
tcaatatgat ttgaaccaag ctgcacaaga 6480/ 
gtcagagcat ggcacagact g'gttacagaa 6540 
atcatttgtg aagcaacaat tcatttgga.a 6600 
tgcttggttc caaggtggtt atetgaagta 6660-- 
ttctgattat cgtcaacctg gtaatgcatt 6720. 
ttctaatcct gttgtgcaag ctgaaaactt 6780 
caccatcact gcgggtcaag -atgacgctaa ,684 0- 
ctttattcat aatgatacaa. tccaacgtac 6900 
.gcaacaaagt gaagccaaag caaaccagca 6960 
aggtacatca acgattcata atgatgcgtt 7020 
attgtcgtta acaaatgaac ctggtaaaaa 7080 
tgacggcggt acgcttatca ccgaccatac 7140. 
aaactattca attattcacg cgcacgataa 7200 
tactgatgct actggtgctg attggacgaa 7260 
agagctattc tataaggatc agcgcgcaac 7320 
aagtatttat gccctgatgt tgacaaacaa 7380 
tatgtatcaa gatgacggac agtatatggc- 74 40 
gtcattaatg acggctcgta aaagctatgt 7500 
tcatggtttg ttgaagagtg tccgttttgg 756,0 
tacatcagct acgcgtactg agggtcttgg 7620 
acttaatgat tcggataaag tgacactgga - 7 680 
tcgcgcagtt atcttaacaa cacgtgatgg 7740 
aacagcttgg acaaacgatc aaggaacgtt 7800 1 
agacaataca caaattcgtg gtgttgctaa 7860 
ggtgcctgtg ggtgcatcag acaatcaaga 7920 
tcatgatggt aaagtattac actcgaatgc 7980 
tttctctaac ttccaaccta aggcaacaac .8040 
taaaaatgcc gatgtcttca ataattgggg • 8100 
ccgttcaagt ggggaccata cattcttgga 8160 
tgatcgctat gacttaggtt tcaatacacc 8220 
tgcaacgatt caagcgctac atcatgctaa 8280 
ccaggtctat aacttacctg gtaaagaagt 8340 - 
taatgacgac gccacgggct ttggaacgca 8400 
tcaataccaa gagaaatatg ctggacaata 84 60 
cctctttgag ggtaaggcct atgattattg 8520 ' 
tccttactat acattgtcac acggtgaccg 8580 
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tgaatctatc 
gaacgttt tg 
caagct tgat 
ttatcttatc 
tcgtctgtaa 
acaattgtca 



ccagcagatg 
ggcaatggta 
ggtga taaat 
aaattgtagt 
agctat gcta 
acacccacgg 



t tgctattaa 
tgggttatgt 
caacattacc 
gacaaaagtc 
taataacgtt 
tattcgtggc 



gcaatggtca 
attgaaggat 
tcaaatttaa 
gcagatattg 
atgacaaaag 
gaagtgaaga 



gctaagtata 
tggcataatg 
tttattttga 
aatccaatat 
aaaattattt 
t tatggatat 



tgaacggcac 8640 
gtcaatattt 8700 
tagggaacga 8760 
ctgcgacttt 8820 
taaagttggc 8880 
c 8931 



<210> 6 

<211> 17 

<212> PRT 

<213> Peptides 

<400> 6 

Ala Asn Trp Asn lie Asp Ser Glu Ser Lys Gly Asn Asp His Leu Gin 
15 10 ' 15 

Gly 



<210> 7 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 7 

Gly Gly Tyr Glu Met Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
1 5 10 15 

Val Val Gin Ala Glu Gin Leu Asn 
20 



<210> 8 

<211> 21 

<212> PRT 

<213> Peptides 

<400> 8 

Ala Asn Phe Asp Gly Tyr Arg Val Asp Ala Val Asp Asn Val Asp Ala 
15 10 15 

Asp Leu Leu Gin lie 
20 



<210> 9 
<211> 12 
<212> PRT 
<213> Peptides 

<400> 9 

His lie Ser He Leu Glu Asp Trp Asp Asn Asn Asp 
1 5 10 
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<210> 10 

<211> 15 

<212> PRT •.. 

<213> Peptides 

<400> 10 

Tvr Ala Phe lie Arg Ala His Asp Ser Glu Val Gin Thr Val lie 
1 5 10 15 



<210> 11 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 11 

Asp Trp Val Pro Asp Gin lie Tyr 
1 5 



<210> 12 

<211> 19 

<212> PRT i . , . 

<213> Peptides t • J 

<400> 12 . 

Phe lie Trp Asn 'Lys, Asp- Ser Glu- Tyr His Gly Gly Gly Asp Ala: Trpv . , . -\ .-0 

i :. 5 io ; 15 * / ' : v : 

Phe Gin Gly • . r .. ... ' . . ' j , > 



<210> 13 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 13 

Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
1 5 10 15 

Val Val Gin Ala Glu Asn Leu Asn ■ 
20 



<210> 14 
<211> 13 
<212> PRT 
<213> Peptides 

<400> 14 

Ala Asn Phe Asp Ser lie Arg lie Asp Ala Val Asp - Phe 
1 5 10 



20 



1er depot 



<210> 15 

<2I1> 8 

<212> PRT 

<213> Peptides 

<400> 15 

His lie Ser Leu Val Glu Ala Gly 
I 5 



<210> 16 

<211> 8 

<212> PRT 

<213> Peptides 

<400> 16 

Tyr Ser He He His Ala His Asp 
1 5 



<210> 17 

<211> 8 

<212> PRT 

<213> Peptides 

<400> 17 

Asp Val Val Asp Asn Gin Val Tyr 
1 5 
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